{
 "cells": [
  {
   "cell_type": "code",
   "execution_count": 10,
   "metadata": {},
   "outputs": [],
   "source": [
    "import pandas as pd\n",
    "from collections import Counter"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 14,
   "metadata": {},
   "outputs": [],
   "source": [
    "# base信息\n",
    "base_train_sum=pd.read_csv(r'./data/base_train_sum.csv',encoding='gb2312').reset_index(drop=True).set_index('ID')\n",
    "base_varify=pd.read_csv(r'./data/base_verify1.csv',encoding='gb2312').reset_index(drop=True).set_index('ID')\n",
    "knowledge_train=pd.read_csv(r'./data/knowledge_train_sum.csv',encoding='gb2312').reset_index(drop=True).set_index('ID')\n",
    "paient_information_verify1=pd.read_csv(r'./data/paient_information_verify1.csv',encoding='gb2312').reset_index(drop=True).set_index('ID')\n",
    "# money信息\n",
    "money_report_train_sum=pd.read_csv(r'./data/money_report_train_sum.csv',encoding='gb2312').reset_index(drop=True).set_index('ID')\n",
    "money_information_verify1=pd.read_csv(r'./data/money_information_verify1.csv',encoding='gb2312').reset_index(drop=True).set_index('ID')\n",
    "year_report_train_sum=pd.read_csv(r'./data/year_report_train_sum.csv',encoding='gb2312').reset_index(drop=True).set_index('ID')\n",
    "year_report_verify1=pd.read_csv(r'./data/year_report_verify1.csv',encoding='gb2312').reset_index(drop=True).set_index('ID')\n"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 15,
   "metadata": {},
   "outputs": [],
   "source": [
    "# 基本信息的数据\n",
    "no_year=pd.concat([pd.concat([base_train_sum,base_varify],sort=True).drop(columns='控制人ID'), pd.concat([knowledge_train,paient_information_verify1],sort=True)],axis=1,sort=True)\n",
    "# no_year"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 16,
   "metadata": {},
   "outputs": [],
   "source": [
    "# 三年的有关money的数据\n",
    "three_year=pd.concat([pd.concat([money_report_train_sum,money_information_verify1]),pd.concat([year_report_train_sum,year_report_verify1]).drop(columns='year')],axis=1)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 17,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "Counter({1.0: 14001, 0.0: 21650})"
      ]
     },
     "execution_count": 17,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "flag_nonull = no_year.dropna(subset=['flag'])\n",
    "Counter(flag_nonull['flag']) "
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 28,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>flag</th>\n",
       "      <th>企业类型</th>\n",
       "      <th>区域</th>\n",
       "      <th>控制人持股比例</th>\n",
       "      <th>控制人类型</th>\n",
       "      <th>注册时间</th>\n",
       "      <th>注册资本</th>\n",
       "      <th>行业</th>\n",
       "      <th>专利</th>\n",
       "      <th>商标</th>\n",
       "      <th>著作权</th>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>ID</th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th>28.0</th>\n",
       "      <td>1.0</td>\n",
       "      <td>农民专业合作社</td>\n",
       "      <td>福建</td>\n",
       "      <td>NaN</td>\n",
       "      <td>企业法人</td>\n",
       "      <td>2007.0</td>\n",
       "      <td>2050.0</td>\n",
       "      <td>交通运输业</td>\n",
       "      <td>0.0</td>\n",
       "      <td>1.0</td>\n",
       "      <td>1.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>230.0</th>\n",
       "      <td>1.0</td>\n",
       "      <td>农民专业合作社</td>\n",
       "      <td>广东</td>\n",
       "      <td>1.00</td>\n",
       "      <td>企业法人</td>\n",
       "      <td>2008.0</td>\n",
       "      <td>3360.0</td>\n",
       "      <td>服务业</td>\n",
       "      <td>0.0</td>\n",
       "      <td>0.0</td>\n",
       "      <td>0.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>429.0</th>\n",
       "      <td>1.0</td>\n",
       "      <td>集体所有制企业</td>\n",
       "      <td>江西</td>\n",
       "      <td>0.75</td>\n",
       "      <td>自然人</td>\n",
       "      <td>2005.0</td>\n",
       "      <td>9670.0</td>\n",
       "      <td>工业</td>\n",
       "      <td>1.0</td>\n",
       "      <td>0.0</td>\n",
       "      <td>0.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>693.0</th>\n",
       "      <td>1.0</td>\n",
       "      <td>股份有限公司</td>\n",
       "      <td>山东</td>\n",
       "      <td>0.98</td>\n",
       "      <td>企业法人</td>\n",
       "      <td>2011.0</td>\n",
       "      <td>8360.0</td>\n",
       "      <td>社区服务</td>\n",
       "      <td>0.0</td>\n",
       "      <td>0.0</td>\n",
       "      <td>0.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>727.0</th>\n",
       "      <td>1.0</td>\n",
       "      <td>股份有限公司</td>\n",
       "      <td>江西</td>\n",
       "      <td>0.54</td>\n",
       "      <td>企业法人</td>\n",
       "      <td>2001.0</td>\n",
       "      <td>8720.0</td>\n",
       "      <td>零售业</td>\n",
       "      <td>0.0</td>\n",
       "      <td>0.0</td>\n",
       "      <td>0.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>...</th>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>3449274.0</th>\n",
       "      <td>1.0</td>\n",
       "      <td>股份有限公司</td>\n",
       "      <td>广东</td>\n",
       "      <td>0.94</td>\n",
       "      <td>自然人</td>\n",
       "      <td>2003.0</td>\n",
       "      <td>7440.0</td>\n",
       "      <td>交通运输业</td>\n",
       "      <td>1.0</td>\n",
       "      <td>0.0</td>\n",
       "      <td>1.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>3449645.0</th>\n",
       "      <td>1.0</td>\n",
       "      <td>有限责任公司</td>\n",
       "      <td>湖北</td>\n",
       "      <td>0.52</td>\n",
       "      <td>企业法人</td>\n",
       "      <td>2009.0</td>\n",
       "      <td>1950.0</td>\n",
       "      <td>商业服务业</td>\n",
       "      <td>0.0</td>\n",
       "      <td>1.0</td>\n",
       "      <td>0.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>3449900.0</th>\n",
       "      <td>1.0</td>\n",
       "      <td>农民专业合作社</td>\n",
       "      <td>湖北</td>\n",
       "      <td>0.60</td>\n",
       "      <td>自然人</td>\n",
       "      <td>2003.0</td>\n",
       "      <td>2770.0</td>\n",
       "      <td>交通运输业</td>\n",
       "      <td>0.0</td>\n",
       "      <td>0.0</td>\n",
       "      <td>0.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>3449919.0</th>\n",
       "      <td>1.0</td>\n",
       "      <td>集体所有制企业</td>\n",
       "      <td>广西</td>\n",
       "      <td>0.80</td>\n",
       "      <td>自然人</td>\n",
       "      <td>2013.0</td>\n",
       "      <td>7980.0</td>\n",
       "      <td>商业服务业</td>\n",
       "      <td>1.0</td>\n",
       "      <td>NaN</td>\n",
       "      <td>1.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>3449944.0</th>\n",
       "      <td>1.0</td>\n",
       "      <td>农民专业合作社</td>\n",
       "      <td>广东</td>\n",
       "      <td>0.61</td>\n",
       "      <td>自然人</td>\n",
       "      <td>2014.0</td>\n",
       "      <td>5880.0</td>\n",
       "      <td>工业</td>\n",
       "      <td>0.0</td>\n",
       "      <td>0.0</td>\n",
       "      <td>1.0</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "<p>14001 rows × 11 columns</p>\n",
       "</div>"
      ],
      "text/plain": [
       "           flag     企业类型  区域  控制人持股比例 控制人类型    注册时间    注册资本     行业   专利   商标  \\\n",
       "ID                                                                             \n",
       "28.0        1.0  农民专业合作社  福建      NaN  企业法人  2007.0  2050.0  交通运输业  0.0  1.0   \n",
       "230.0       1.0  农民专业合作社  广东     1.00  企业法人  2008.0  3360.0    服务业  0.0  0.0   \n",
       "429.0       1.0  集体所有制企业  江西     0.75   自然人  2005.0  9670.0     工业  1.0  0.0   \n",
       "693.0       1.0   股份有限公司  山东     0.98  企业法人  2011.0  8360.0   社区服务  0.0  0.0   \n",
       "727.0       1.0   股份有限公司  江西     0.54  企业法人  2001.0  8720.0    零售业  0.0  0.0   \n",
       "...         ...      ...  ..      ...   ...     ...     ...    ...  ...  ...   \n",
       "3449274.0   1.0   股份有限公司  广东     0.94   自然人  2003.0  7440.0  交通运输业  1.0  0.0   \n",
       "3449645.0   1.0   有限责任公司  湖北     0.52  企业法人  2009.0  1950.0  商业服务业  0.0  1.0   \n",
       "3449900.0   1.0  农民专业合作社  湖北     0.60   自然人  2003.0  2770.0  交通运输业  0.0  0.0   \n",
       "3449919.0   1.0  集体所有制企业  广西     0.80   自然人  2013.0  7980.0  商业服务业  1.0  NaN   \n",
       "3449944.0   1.0  农民专业合作社  广东     0.61   自然人  2014.0  5880.0     工业  0.0  0.0   \n",
       "\n",
       "           著作权  \n",
       "ID              \n",
       "28.0       1.0  \n",
       "230.0      0.0  \n",
       "429.0      0.0  \n",
       "693.0      0.0  \n",
       "727.0      0.0  \n",
       "...        ...  \n",
       "3449274.0  1.0  \n",
       "3449645.0  0.0  \n",
       "3449900.0  0.0  \n",
       "3449919.0  1.0  \n",
       "3449944.0  1.0  \n",
       "\n",
       "[14001 rows x 11 columns]"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    },
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>flag</th>\n",
       "      <th>企业类型</th>\n",
       "      <th>区域</th>\n",
       "      <th>控制人持股比例</th>\n",
       "      <th>控制人类型</th>\n",
       "      <th>注册时间</th>\n",
       "      <th>注册资本</th>\n",
       "      <th>行业</th>\n",
       "      <th>专利</th>\n",
       "      <th>商标</th>\n",
       "      <th>著作权</th>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>ID</th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th>5978034.0</th>\n",
       "      <td>0.0</td>\n",
       "      <td>合伙企业</td>\n",
       "      <td>湖南</td>\n",
       "      <td>0.70</td>\n",
       "      <td>自然人</td>\n",
       "      <td>2009.0</td>\n",
       "      <td>5600.0</td>\n",
       "      <td>工业</td>\n",
       "      <td>0.0</td>\n",
       "      <td>1.0</td>\n",
       "      <td>1.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>5978036.0</th>\n",
       "      <td>0.0</td>\n",
       "      <td>股份有限公司</td>\n",
       "      <td>湖北</td>\n",
       "      <td>0.54</td>\n",
       "      <td>自然人</td>\n",
       "      <td>2012.0</td>\n",
       "      <td>7960.0</td>\n",
       "      <td>商业服务业</td>\n",
       "      <td>0.0</td>\n",
       "      <td>0.0</td>\n",
       "      <td>1.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>5978037.0</th>\n",
       "      <td>0.0</td>\n",
       "      <td>农民专业合作社</td>\n",
       "      <td>山东</td>\n",
       "      <td>0.97</td>\n",
       "      <td>企业法人</td>\n",
       "      <td>2012.0</td>\n",
       "      <td>6590.0</td>\n",
       "      <td>商业服务业</td>\n",
       "      <td>1.0</td>\n",
       "      <td>1.0</td>\n",
       "      <td>1.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>5978038.0</th>\n",
       "      <td>0.0</td>\n",
       "      <td>股份有限公司</td>\n",
       "      <td>江西</td>\n",
       "      <td>0.91</td>\n",
       "      <td>自然人</td>\n",
       "      <td>2006.0</td>\n",
       "      <td>5650.0</td>\n",
       "      <td>商业服务业</td>\n",
       "      <td>0.0</td>\n",
       "      <td>0.0</td>\n",
       "      <td>0.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>5978039.0</th>\n",
       "      <td>0.0</td>\n",
       "      <td>集体所有制企业</td>\n",
       "      <td>山东</td>\n",
       "      <td>0.88</td>\n",
       "      <td>自然人</td>\n",
       "      <td>2009.0</td>\n",
       "      <td>NaN</td>\n",
       "      <td>服务业</td>\n",
       "      <td>0.0</td>\n",
       "      <td>0.0</td>\n",
       "      <td>0.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>...</th>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>5999996.0</th>\n",
       "      <td>0.0</td>\n",
       "      <td>农民专业合作社</td>\n",
       "      <td>湖北</td>\n",
       "      <td>0.93</td>\n",
       "      <td>自然人</td>\n",
       "      <td>2011.0</td>\n",
       "      <td>2170.0</td>\n",
       "      <td>零售业</td>\n",
       "      <td>1.0</td>\n",
       "      <td>1.0</td>\n",
       "      <td>0.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>5999997.0</th>\n",
       "      <td>0.0</td>\n",
       "      <td>集体所有制企业</td>\n",
       "      <td>福建</td>\n",
       "      <td>0.73</td>\n",
       "      <td>企业法人</td>\n",
       "      <td>2013.0</td>\n",
       "      <td>9030.0</td>\n",
       "      <td>交通运输业</td>\n",
       "      <td>1.0</td>\n",
       "      <td>1.0</td>\n",
       "      <td>0.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>5999998.0</th>\n",
       "      <td>0.0</td>\n",
       "      <td>股份有限公司</td>\n",
       "      <td>湖南</td>\n",
       "      <td>0.64</td>\n",
       "      <td>自然人</td>\n",
       "      <td>2014.0</td>\n",
       "      <td>4510.0</td>\n",
       "      <td>服务业</td>\n",
       "      <td>0.0</td>\n",
       "      <td>0.0</td>\n",
       "      <td>0.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>5999999.0</th>\n",
       "      <td>0.0</td>\n",
       "      <td>股份有限公司</td>\n",
       "      <td>福建</td>\n",
       "      <td>0.80</td>\n",
       "      <td>自然人</td>\n",
       "      <td>2014.0</td>\n",
       "      <td>9130.0</td>\n",
       "      <td>交通运输业</td>\n",
       "      <td>1.0</td>\n",
       "      <td>1.0</td>\n",
       "      <td>1.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>6000000.0</th>\n",
       "      <td>0.0</td>\n",
       "      <td>股份有限公司</td>\n",
       "      <td>广东</td>\n",
       "      <td>0.53</td>\n",
       "      <td>企业法人</td>\n",
       "      <td>2000.0</td>\n",
       "      <td>9520.0</td>\n",
       "      <td>交通运输业</td>\n",
       "      <td>0.0</td>\n",
       "      <td>0.0</td>\n",
       "      <td>0.0</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "<p>21650 rows × 11 columns</p>\n",
       "</div>"
      ],
      "text/plain": [
       "           flag     企业类型  区域  控制人持股比例 控制人类型    注册时间    注册资本     行业   专利   商标  \\\n",
       "ID                                                                             \n",
       "5978034.0   0.0     合伙企业  湖南     0.70   自然人  2009.0  5600.0     工业  0.0  1.0   \n",
       "5978036.0   0.0   股份有限公司  湖北     0.54   自然人  2012.0  7960.0  商业服务业  0.0  0.0   \n",
       "5978037.0   0.0  农民专业合作社  山东     0.97  企业法人  2012.0  6590.0  商业服务业  1.0  1.0   \n",
       "5978038.0   0.0   股份有限公司  江西     0.91   自然人  2006.0  5650.0  商业服务业  0.0  0.0   \n",
       "5978039.0   0.0  集体所有制企业  山东     0.88   自然人  2009.0     NaN    服务业  0.0  0.0   \n",
       "...         ...      ...  ..      ...   ...     ...     ...    ...  ...  ...   \n",
       "5999996.0   0.0  农民专业合作社  湖北     0.93   自然人  2011.0  2170.0    零售业  1.0  1.0   \n",
       "5999997.0   0.0  集体所有制企业  福建     0.73  企业法人  2013.0  9030.0  交通运输业  1.0  1.0   \n",
       "5999998.0   0.0   股份有限公司  湖南     0.64   自然人  2014.0  4510.0    服务业  0.0  0.0   \n",
       "5999999.0   0.0   股份有限公司  福建     0.80   自然人  2014.0  9130.0  交通运输业  1.0  1.0   \n",
       "6000000.0   0.0   股份有限公司  广东     0.53  企业法人  2000.0  9520.0  交通运输业  0.0  0.0   \n",
       "\n",
       "           著作权  \n",
       "ID              \n",
       "5978034.0  1.0  \n",
       "5978036.0  1.0  \n",
       "5978037.0  1.0  \n",
       "5978038.0  0.0  \n",
       "5978039.0  0.0  \n",
       "...        ...  \n",
       "5999996.0  0.0  \n",
       "5999997.0  0.0  \n",
       "5999998.0  0.0  \n",
       "5999999.0  1.0  \n",
       "6000000.0  0.0  \n",
       "\n",
       "[21650 rows x 11 columns]"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    }
   ],
   "source": [
    "y_flag = flag_nonull[flag_nonull['flag']==1]\n",
    "n_flag = flag_nonull[flag_nonull['flag']==0]\n",
    "display(y_flag,n_flag)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 29,
   "metadata": {},
   "outputs": [],
   "source": [
    "re_time_y = dict(Counter(y_flag['注册时间'].dropna()))\n",
    "re_time_n = dict(Counter(n_flag['注册时间'].dropna()))"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 30,
   "metadata": {},
   "outputs": [],
   "source": [
    "dic_time_y = {i:re_time_y[i] for i in sorted(list(re_time_y.keys()))}\n",
    "dic_time_n = {i:re_time_n[i] for i in sorted(list(re_time_n.keys()))}"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 31,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "{2000.0: 927,\n",
       " 2001.0: 939,\n",
       " 2002.0: 908,\n",
       " 2003.0: 926,\n",
       " 2004.0: 870,\n",
       " 2005.0: 908,\n",
       " 2006.0: 947,\n",
       " 2007.0: 939,\n",
       " 2008.0: 932,\n",
       " 2009.0: 933,\n",
       " 2010.0: 952,\n",
       " 2011.0: 902,\n",
       " 2012.0: 932,\n",
       " 2013.0: 941,\n",
       " 2014.0: 907}"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    },
    {
     "data": {
      "text/plain": [
       "{2000.0: 1412,\n",
       " 2001.0: 1401,\n",
       " 2002.0: 1473,\n",
       " 2003.0: 1417,\n",
       " 2004.0: 1429,\n",
       " 2005.0: 1392,\n",
       " 2006.0: 1478,\n",
       " 2007.0: 1392,\n",
       " 2008.0: 1376,\n",
       " 2009.0: 1434,\n",
       " 2010.0: 1398,\n",
       " 2011.0: 1418,\n",
       " 2012.0: 1444,\n",
       " 2013.0: 1455,\n",
       " 2014.0: 1498}"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    }
   ],
   "source": [
    "display(dic_time_y,dic_time_n)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 36,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "Counter({'合伙企业': 4412,\n",
       "         '股份有限公司': 4248,\n",
       "         '农民专业合作社': 4237,\n",
       "         '集体所有制企业': 4312,\n",
       "         '有限责任公司': 4224,\n",
       "         nan: 217})"
      ]
     },
     "execution_count": 36,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "Counter(n_flag['企业类型'])"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 43,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "Counter({'工业': 3534,\n",
       "         '商业服务业': 3602,\n",
       "         '服务业': 3612,\n",
       "         '零售业': 3549,\n",
       "         '社区服务': 3560,\n",
       "         '交通运输业': 3593,\n",
       "         nan: 200})"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    },
    {
     "data": {
      "text/plain": [
       "Counter({'交通运输业': 6003,\n",
       "         '服务业': 5883,\n",
       "         '工业': 5870,\n",
       "         '社区服务': 5829,\n",
       "         '零售业': 5837,\n",
       "         '商业服务业': 5906,\n",
       "         nan: 323})"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    }
   ],
   "source": [
    "display(Counter(n_flag['行业']),Counter(flag_nonull['行业']))\n",
    "re_n_flag = Counter(n_flag['行业'])\n",
    "re_flag_null = Counter(flag_nonull['行业'])"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 51,
   "metadata": {},
   "outputs": [],
   "source": [
    "dic_fild_n = {i:re_flag_null[i] for i in list(re_n_flag.keys())}"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 52,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "{'工业': 5870,\n",
       " '商业服务业': 5906,\n",
       " '服务业': 5883,\n",
       " '零售业': 5837,\n",
       " '社区服务': 5829,\n",
       " '交通运输业': 6003,\n",
       " nan: 323}"
      ]
     },
     "execution_count": 52,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "dic_fild_n"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 62,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "[(60.20442930153322, 5870),\n",
       " (60.9888249238063, 5906),\n",
       " (61.39724630290668, 5883),\n",
       " (60.801781737193764, 5837),\n",
       " (61.07394064161949, 5829),\n",
       " (59.85340663001833, 6003),\n",
       " (61.919504643962846, 323)]"
      ]
     },
     "execution_count": 62,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "[(100*i/j, j) for i, j in zip(re_n_flag.values(), dic_fild_n.values())]"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 63,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "Counter({'福建': 1974,\n",
       "         '广东': 1973,\n",
       "         '江西': 2038,\n",
       "         '山东': 1946,\n",
       "         '广西': 2025,\n",
       "         '湖南': 1970,\n",
       "         '湖北': 1951,\n",
       "         nan: 124})"
      ]
     },
     "execution_count": 63,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "Counter(y_flag['区域'])"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [],
   "source": []
  },
  {
   "cell_type": "code",
   "execution_count": 33,
   "metadata": {},
   "outputs": [],
   "source": [
    "peo_ = three_year.dropna(subset=['year','从业人数'])\n",
    "peo__2015 = nashui_[nashui_['year']==2015]\n",
    "peo__2016 = nashui_[nashui_['year']==2016]\n",
    "peo__2017 = nashui_[nashui_['year']==2017]"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 36,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>flag</th>\n",
       "      <th>企业类型</th>\n",
       "      <th>区域</th>\n",
       "      <th>控制人持股比例</th>\n",
       "      <th>控制人类型</th>\n",
       "      <th>注册时间</th>\n",
       "      <th>注册资本</th>\n",
       "      <th>行业</th>\n",
       "      <th>专利</th>\n",
       "      <th>商标</th>\n",
       "      <th>...</th>\n",
       "      <th>项目融资和政策融资成本</th>\n",
       "      <th>从业人数</th>\n",
       "      <th>资产总额</th>\n",
       "      <th>负债总额</th>\n",
       "      <th>营业总收入</th>\n",
       "      <th>主营业务收入</th>\n",
       "      <th>利润总额</th>\n",
       "      <th>净利润</th>\n",
       "      <th>纳税总额</th>\n",
       "      <th>所有者权益合计</th>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>ID</th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th>230.0</th>\n",
       "      <td>1.0</td>\n",
       "      <td>农民专业合作社</td>\n",
       "      <td>广东</td>\n",
       "      <td>1.00</td>\n",
       "      <td>企业法人</td>\n",
       "      <td>2008.0</td>\n",
       "      <td>3360.0</td>\n",
       "      <td>服务业</td>\n",
       "      <td>0.0</td>\n",
       "      <td>0.0</td>\n",
       "      <td>...</td>\n",
       "      <td>28.224</td>\n",
       "      <td>485.0</td>\n",
       "      <td>23520.0</td>\n",
       "      <td>10080.0</td>\n",
       "      <td>115248.0</td>\n",
       "      <td>57624.0</td>\n",
       "      <td>57624.0</td>\n",
       "      <td>-11524.8</td>\n",
       "      <td>0.0</td>\n",
       "      <td>13440.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>693.0</th>\n",
       "      <td>1.0</td>\n",
       "      <td>股份有限公司</td>\n",
       "      <td>山东</td>\n",
       "      <td>0.98</td>\n",
       "      <td>企业法人</td>\n",
       "      <td>2011.0</td>\n",
       "      <td>8360.0</td>\n",
       "      <td>社区服务</td>\n",
       "      <td>0.0</td>\n",
       "      <td>0.0</td>\n",
       "      <td>...</td>\n",
       "      <td>321.024</td>\n",
       "      <td>534.0</td>\n",
       "      <td>133760.0</td>\n",
       "      <td>125400.0</td>\n",
       "      <td>655424.0</td>\n",
       "      <td>262169.6</td>\n",
       "      <td>196627.2</td>\n",
       "      <td>-65542.4</td>\n",
       "      <td>0.0</td>\n",
       "      <td>8360.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>727.0</th>\n",
       "      <td>1.0</td>\n",
       "      <td>股份有限公司</td>\n",
       "      <td>江西</td>\n",
       "      <td>0.54</td>\n",
       "      <td>企业法人</td>\n",
       "      <td>2001.0</td>\n",
       "      <td>8720.0</td>\n",
       "      <td>零售业</td>\n",
       "      <td>0.0</td>\n",
       "      <td>0.0</td>\n",
       "      <td>...</td>\n",
       "      <td>0.000</td>\n",
       "      <td>375.0</td>\n",
       "      <td>366240.0</td>\n",
       "      <td>536280.0</td>\n",
       "      <td>402864.0</td>\n",
       "      <td>282004.8</td>\n",
       "      <td>161145.6</td>\n",
       "      <td>-40286.4</td>\n",
       "      <td>0.0</td>\n",
       "      <td>-170040.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1560.0</th>\n",
       "      <td>1.0</td>\n",
       "      <td>农民专业合作社</td>\n",
       "      <td>湖南</td>\n",
       "      <td>0.61</td>\n",
       "      <td>自然人</td>\n",
       "      <td>2000.0</td>\n",
       "      <td>7000.0</td>\n",
       "      <td>工业</td>\n",
       "      <td>0.0</td>\n",
       "      <td>1.0</td>\n",
       "      <td>...</td>\n",
       "      <td>0.000</td>\n",
       "      <td>491.0</td>\n",
       "      <td>105000.0</td>\n",
       "      <td>98000.0</td>\n",
       "      <td>147000.0</td>\n",
       "      <td>73500.0</td>\n",
       "      <td>29400.0</td>\n",
       "      <td>-14700.0</td>\n",
       "      <td>0.0</td>\n",
       "      <td>7000.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1873.0</th>\n",
       "      <td>1.0</td>\n",
       "      <td>农民专业合作社</td>\n",
       "      <td>山东</td>\n",
       "      <td>0.53</td>\n",
       "      <td>企业法人</td>\n",
       "      <td>2006.0</td>\n",
       "      <td>6370.0</td>\n",
       "      <td>社区服务</td>\n",
       "      <td>1.0</td>\n",
       "      <td>1.0</td>\n",
       "      <td>...</td>\n",
       "      <td>0.000</td>\n",
       "      <td>889.0</td>\n",
       "      <td>229320.0</td>\n",
       "      <td>222950.0</td>\n",
       "      <td>137592.0</td>\n",
       "      <td>55036.8</td>\n",
       "      <td>55036.8</td>\n",
       "      <td>-13759.2</td>\n",
       "      <td>0.0</td>\n",
       "      <td>6370.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>...</th>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>5999995.0</th>\n",
       "      <td>0.0</td>\n",
       "      <td>合伙企业</td>\n",
       "      <td>湖南</td>\n",
       "      <td>0.83</td>\n",
       "      <td>企业法人</td>\n",
       "      <td>2000.0</td>\n",
       "      <td>9650.0</td>\n",
       "      <td>工业</td>\n",
       "      <td>0.0</td>\n",
       "      <td>1.0</td>\n",
       "      <td>...</td>\n",
       "      <td>173.700</td>\n",
       "      <td>150.0</td>\n",
       "      <td>144750.0</td>\n",
       "      <td>202650.0</td>\n",
       "      <td>709275.0</td>\n",
       "      <td>354637.5</td>\n",
       "      <td>283710.0</td>\n",
       "      <td>70927.5</td>\n",
       "      <td>141855.0</td>\n",
       "      <td>-57900.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>5999996.0</th>\n",
       "      <td>0.0</td>\n",
       "      <td>农民专业合作社</td>\n",
       "      <td>湖北</td>\n",
       "      <td>0.93</td>\n",
       "      <td>自然人</td>\n",
       "      <td>2011.0</td>\n",
       "      <td>2170.0</td>\n",
       "      <td>零售业</td>\n",
       "      <td>1.0</td>\n",
       "      <td>1.0</td>\n",
       "      <td>...</td>\n",
       "      <td>0.000</td>\n",
       "      <td>835.0</td>\n",
       "      <td>8680.0</td>\n",
       "      <td>6510.0</td>\n",
       "      <td>24304.0</td>\n",
       "      <td>19443.2</td>\n",
       "      <td>9721.6</td>\n",
       "      <td>4860.8</td>\n",
       "      <td>9721.6</td>\n",
       "      <td>2170.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>5999997.0</th>\n",
       "      <td>0.0</td>\n",
       "      <td>集体所有制企业</td>\n",
       "      <td>福建</td>\n",
       "      <td>0.73</td>\n",
       "      <td>企业法人</td>\n",
       "      <td>2013.0</td>\n",
       "      <td>9030.0</td>\n",
       "      <td>交通运输业</td>\n",
       "      <td>1.0</td>\n",
       "      <td>1.0</td>\n",
       "      <td>...</td>\n",
       "      <td>0.000</td>\n",
       "      <td>362.0</td>\n",
       "      <td>90300.0</td>\n",
       "      <td>81270.0</td>\n",
       "      <td>397320.0</td>\n",
       "      <td>238392.0</td>\n",
       "      <td>198660.0</td>\n",
       "      <td>79464.0</td>\n",
       "      <td>238392.0</td>\n",
       "      <td>9030.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>5999998.0</th>\n",
       "      <td>0.0</td>\n",
       "      <td>股份有限公司</td>\n",
       "      <td>湖南</td>\n",
       "      <td>0.64</td>\n",
       "      <td>自然人</td>\n",
       "      <td>2014.0</td>\n",
       "      <td>4510.0</td>\n",
       "      <td>服务业</td>\n",
       "      <td>0.0</td>\n",
       "      <td>0.0</td>\n",
       "      <td>...</td>\n",
       "      <td>8.118</td>\n",
       "      <td>930.0</td>\n",
       "      <td>13530.0</td>\n",
       "      <td>18040.0</td>\n",
       "      <td>4059.0</td>\n",
       "      <td>2841.3</td>\n",
       "      <td>1623.6</td>\n",
       "      <td>811.8</td>\n",
       "      <td>2435.4</td>\n",
       "      <td>-4510.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>5999999.0</th>\n",
       "      <td>0.0</td>\n",
       "      <td>股份有限公司</td>\n",
       "      <td>福建</td>\n",
       "      <td>0.80</td>\n",
       "      <td>自然人</td>\n",
       "      <td>2014.0</td>\n",
       "      <td>9130.0</td>\n",
       "      <td>交通运输业</td>\n",
       "      <td>1.0</td>\n",
       "      <td>1.0</td>\n",
       "      <td>...</td>\n",
       "      <td>0.000</td>\n",
       "      <td>885.0</td>\n",
       "      <td>27390.0</td>\n",
       "      <td>9130.0</td>\n",
       "      <td>60258.0</td>\n",
       "      <td>42180.6</td>\n",
       "      <td>30129.0</td>\n",
       "      <td>6025.8</td>\n",
       "      <td>24103.2</td>\n",
       "      <td>18260.0</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "<p>26877 rows × 29 columns</p>\n",
       "</div>"
      ],
      "text/plain": [
       "           flag     企业类型  区域  控制人持股比例 控制人类型    注册时间    注册资本     行业   专利   商标  \\\n",
       "ID                                                                             \n",
       "230.0       1.0  农民专业合作社  广东     1.00  企业法人  2008.0  3360.0    服务业  0.0  0.0   \n",
       "693.0       1.0   股份有限公司  山东     0.98  企业法人  2011.0  8360.0   社区服务  0.0  0.0   \n",
       "727.0       1.0   股份有限公司  江西     0.54  企业法人  2001.0  8720.0    零售业  0.0  0.0   \n",
       "1560.0      1.0  农民专业合作社  湖南     0.61   自然人  2000.0  7000.0     工业  0.0  1.0   \n",
       "1873.0      1.0  农民专业合作社  山东     0.53  企业法人  2006.0  6370.0   社区服务  1.0  1.0   \n",
       "...         ...      ...  ..      ...   ...     ...     ...    ...  ...  ...   \n",
       "5999995.0   0.0     合伙企业  湖南     0.83  企业法人  2000.0  9650.0     工业  0.0  1.0   \n",
       "5999996.0   0.0  农民专业合作社  湖北     0.93   自然人  2011.0  2170.0    零售业  1.0  1.0   \n",
       "5999997.0   0.0  集体所有制企业  福建     0.73  企业法人  2013.0  9030.0  交通运输业  1.0  1.0   \n",
       "5999998.0   0.0   股份有限公司  湖南     0.64   自然人  2014.0  4510.0    服务业  0.0  0.0   \n",
       "5999999.0   0.0   股份有限公司  福建     0.80   自然人  2014.0  9130.0  交通运输业  1.0  1.0   \n",
       "\n",
       "           ...  项目融资和政策融资成本   从业人数      资产总额      负债总额     营业总收入    主营业务收入  \\\n",
       "ID         ...                                                               \n",
       "230.0      ...       28.224  485.0   23520.0   10080.0  115248.0   57624.0   \n",
       "693.0      ...      321.024  534.0  133760.0  125400.0  655424.0  262169.6   \n",
       "727.0      ...        0.000  375.0  366240.0  536280.0  402864.0  282004.8   \n",
       "1560.0     ...        0.000  491.0  105000.0   98000.0  147000.0   73500.0   \n",
       "1873.0     ...        0.000  889.0  229320.0  222950.0  137592.0   55036.8   \n",
       "...        ...          ...    ...       ...       ...       ...       ...   \n",
       "5999995.0  ...      173.700  150.0  144750.0  202650.0  709275.0  354637.5   \n",
       "5999996.0  ...        0.000  835.0    8680.0    6510.0   24304.0   19443.2   \n",
       "5999997.0  ...        0.000  362.0   90300.0   81270.0  397320.0  238392.0   \n",
       "5999998.0  ...        8.118  930.0   13530.0   18040.0    4059.0    2841.3   \n",
       "5999999.0  ...        0.000  885.0   27390.0    9130.0   60258.0   42180.6   \n",
       "\n",
       "               利润总额      净利润      纳税总额   所有者权益合计  \n",
       "ID                                                \n",
       "230.0       57624.0 -11524.8       0.0   13440.0  \n",
       "693.0      196627.2 -65542.4       0.0    8360.0  \n",
       "727.0      161145.6 -40286.4       0.0 -170040.0  \n",
       "1560.0      29400.0 -14700.0       0.0    7000.0  \n",
       "1873.0      55036.8 -13759.2       0.0    6370.0  \n",
       "...             ...      ...       ...       ...  \n",
       "5999995.0  283710.0  70927.5  141855.0  -57900.0  \n",
       "5999996.0    9721.6   4860.8    9721.6    2170.0  \n",
       "5999997.0  198660.0  79464.0  238392.0    9030.0  \n",
       "5999998.0    1623.6    811.8    2435.4   -4510.0  \n",
       "5999999.0   30129.0   6025.8   24103.2   18260.0  \n",
       "\n",
       "[26877 rows x 29 columns]"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    },
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>flag</th>\n",
       "      <th>企业类型</th>\n",
       "      <th>区域</th>\n",
       "      <th>控制人持股比例</th>\n",
       "      <th>控制人类型</th>\n",
       "      <th>注册时间</th>\n",
       "      <th>注册资本</th>\n",
       "      <th>行业</th>\n",
       "      <th>专利</th>\n",
       "      <th>商标</th>\n",
       "      <th>...</th>\n",
       "      <th>项目融资和政策融资成本</th>\n",
       "      <th>从业人数</th>\n",
       "      <th>资产总额</th>\n",
       "      <th>负债总额</th>\n",
       "      <th>营业总收入</th>\n",
       "      <th>主营业务收入</th>\n",
       "      <th>利润总额</th>\n",
       "      <th>净利润</th>\n",
       "      <th>纳税总额</th>\n",
       "      <th>所有者权益合计</th>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>ID</th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th>230.0</th>\n",
       "      <td>1.0</td>\n",
       "      <td>农民专业合作社</td>\n",
       "      <td>广东</td>\n",
       "      <td>1.00</td>\n",
       "      <td>企业法人</td>\n",
       "      <td>2008.0</td>\n",
       "      <td>3360.0</td>\n",
       "      <td>服务业</td>\n",
       "      <td>0.0</td>\n",
       "      <td>0.0</td>\n",
       "      <td>...</td>\n",
       "      <td>0.0</td>\n",
       "      <td>365.0</td>\n",
       "      <td>53760.0</td>\n",
       "      <td>50400.0</td>\n",
       "      <td>155904.0</td>\n",
       "      <td>124723.2</td>\n",
       "      <td>46771.2</td>\n",
       "      <td>-15590.4</td>\n",
       "      <td>0.0</td>\n",
       "      <td>3360.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>429.0</th>\n",
       "      <td>1.0</td>\n",
       "      <td>集体所有制企业</td>\n",
       "      <td>江西</td>\n",
       "      <td>0.75</td>\n",
       "      <td>自然人</td>\n",
       "      <td>2005.0</td>\n",
       "      <td>9670.0</td>\n",
       "      <td>工业</td>\n",
       "      <td>1.0</td>\n",
       "      <td>0.0</td>\n",
       "      <td>...</td>\n",
       "      <td>0.0</td>\n",
       "      <td>678.0</td>\n",
       "      <td>531850.0</td>\n",
       "      <td>783270.0</td>\n",
       "      <td>1329625.0</td>\n",
       "      <td>531850.0</td>\n",
       "      <td>132962.5</td>\n",
       "      <td>-132962.5</td>\n",
       "      <td>0.0</td>\n",
       "      <td>-251420.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>693.0</th>\n",
       "      <td>1.0</td>\n",
       "      <td>股份有限公司</td>\n",
       "      <td>山东</td>\n",
       "      <td>0.98</td>\n",
       "      <td>企业法人</td>\n",
       "      <td>2011.0</td>\n",
       "      <td>8360.0</td>\n",
       "      <td>社区服务</td>\n",
       "      <td>0.0</td>\n",
       "      <td>0.0</td>\n",
       "      <td>...</td>\n",
       "      <td>0.0</td>\n",
       "      <td>366.0</td>\n",
       "      <td>41800.0</td>\n",
       "      <td>66880.0</td>\n",
       "      <td>183920.0</td>\n",
       "      <td>91960.0</td>\n",
       "      <td>36784.0</td>\n",
       "      <td>-18392.0</td>\n",
       "      <td>0.0</td>\n",
       "      <td>-25080.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>727.0</th>\n",
       "      <td>1.0</td>\n",
       "      <td>股份有限公司</td>\n",
       "      <td>江西</td>\n",
       "      <td>0.54</td>\n",
       "      <td>企业法人</td>\n",
       "      <td>2001.0</td>\n",
       "      <td>8720.0</td>\n",
       "      <td>零售业</td>\n",
       "      <td>0.0</td>\n",
       "      <td>0.0</td>\n",
       "      <td>...</td>\n",
       "      <td>0.0</td>\n",
       "      <td>872.0</td>\n",
       "      <td>130800.0</td>\n",
       "      <td>183120.0</td>\n",
       "      <td>483960.0</td>\n",
       "      <td>241980.0</td>\n",
       "      <td>48396.0</td>\n",
       "      <td>-48396.0</td>\n",
       "      <td>0.0</td>\n",
       "      <td>-52320.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>990.0</th>\n",
       "      <td>1.0</td>\n",
       "      <td>集体所有制企业</td>\n",
       "      <td>广西</td>\n",
       "      <td>0.75</td>\n",
       "      <td>自然人</td>\n",
       "      <td>2014.0</td>\n",
       "      <td>8440.0</td>\n",
       "      <td>社区服务</td>\n",
       "      <td>0.0</td>\n",
       "      <td>0.0</td>\n",
       "      <td>...</td>\n",
       "      <td>0.0</td>\n",
       "      <td>177.0</td>\n",
       "      <td>16880.0</td>\n",
       "      <td>4220.0</td>\n",
       "      <td>75960.0</td>\n",
       "      <td>30384.0</td>\n",
       "      <td>7596.0</td>\n",
       "      <td>-7596.0</td>\n",
       "      <td>0.0</td>\n",
       "      <td>12660.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>...</th>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>5999994.0</th>\n",
       "      <td>0.0</td>\n",
       "      <td>股份有限公司</td>\n",
       "      <td>湖南</td>\n",
       "      <td>0.65</td>\n",
       "      <td>企业法人</td>\n",
       "      <td>2011.0</td>\n",
       "      <td>2960.0</td>\n",
       "      <td>商业服务业</td>\n",
       "      <td>0.0</td>\n",
       "      <td>0.0</td>\n",
       "      <td>...</td>\n",
       "      <td>0.0</td>\n",
       "      <td>163.0</td>\n",
       "      <td>14800.0</td>\n",
       "      <td>11840.0</td>\n",
       "      <td>22200.0</td>\n",
       "      <td>11100.0</td>\n",
       "      <td>8880.0</td>\n",
       "      <td>8880.0</td>\n",
       "      <td>8880.0</td>\n",
       "      <td>2960.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>5999995.0</th>\n",
       "      <td>0.0</td>\n",
       "      <td>合伙企业</td>\n",
       "      <td>湖南</td>\n",
       "      <td>0.83</td>\n",
       "      <td>企业法人</td>\n",
       "      <td>2000.0</td>\n",
       "      <td>9650.0</td>\n",
       "      <td>工业</td>\n",
       "      <td>0.0</td>\n",
       "      <td>1.0</td>\n",
       "      <td>...</td>\n",
       "      <td>0.0</td>\n",
       "      <td>528.0</td>\n",
       "      <td>154400.0</td>\n",
       "      <td>144750.0</td>\n",
       "      <td>293360.0</td>\n",
       "      <td>234688.0</td>\n",
       "      <td>146680.0</td>\n",
       "      <td>58672.0</td>\n",
       "      <td>176016.0</td>\n",
       "      <td>9650.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>5999996.0</th>\n",
       "      <td>0.0</td>\n",
       "      <td>农民专业合作社</td>\n",
       "      <td>湖北</td>\n",
       "      <td>0.93</td>\n",
       "      <td>自然人</td>\n",
       "      <td>2011.0</td>\n",
       "      <td>2170.0</td>\n",
       "      <td>零售业</td>\n",
       "      <td>1.0</td>\n",
       "      <td>1.0</td>\n",
       "      <td>...</td>\n",
       "      <td>0.0</td>\n",
       "      <td>473.0</td>\n",
       "      <td>32550.0</td>\n",
       "      <td>45570.0</td>\n",
       "      <td>39060.0</td>\n",
       "      <td>31248.0</td>\n",
       "      <td>11718.0</td>\n",
       "      <td>3906.0</td>\n",
       "      <td>23436.0</td>\n",
       "      <td>-13020.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>5999997.0</th>\n",
       "      <td>0.0</td>\n",
       "      <td>集体所有制企业</td>\n",
       "      <td>福建</td>\n",
       "      <td>0.73</td>\n",
       "      <td>企业法人</td>\n",
       "      <td>2013.0</td>\n",
       "      <td>9030.0</td>\n",
       "      <td>交通运输业</td>\n",
       "      <td>1.0</td>\n",
       "      <td>1.0</td>\n",
       "      <td>...</td>\n",
       "      <td>0.0</td>\n",
       "      <td>356.0</td>\n",
       "      <td>81270.0</td>\n",
       "      <td>36120.0</td>\n",
       "      <td>398223.0</td>\n",
       "      <td>199111.5</td>\n",
       "      <td>199111.5</td>\n",
       "      <td>159289.2</td>\n",
       "      <td>238933.8</td>\n",
       "      <td>45150.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>5999999.0</th>\n",
       "      <td>0.0</td>\n",
       "      <td>股份有限公司</td>\n",
       "      <td>福建</td>\n",
       "      <td>0.80</td>\n",
       "      <td>自然人</td>\n",
       "      <td>2014.0</td>\n",
       "      <td>9130.0</td>\n",
       "      <td>交通运输业</td>\n",
       "      <td>1.0</td>\n",
       "      <td>1.0</td>\n",
       "      <td>...</td>\n",
       "      <td>0.0</td>\n",
       "      <td>933.0</td>\n",
       "      <td>73040.0</td>\n",
       "      <td>95865.0</td>\n",
       "      <td>51128.0</td>\n",
       "      <td>25564.0</td>\n",
       "      <td>5112.8</td>\n",
       "      <td>0.0</td>\n",
       "      <td>10225.6</td>\n",
       "      <td>-22825.0</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "<p>26951 rows × 29 columns</p>\n",
       "</div>"
      ],
      "text/plain": [
       "           flag     企业类型  区域  控制人持股比例 控制人类型    注册时间    注册资本     行业   专利   商标  \\\n",
       "ID                                                                             \n",
       "230.0       1.0  农民专业合作社  广东     1.00  企业法人  2008.0  3360.0    服务业  0.0  0.0   \n",
       "429.0       1.0  集体所有制企业  江西     0.75   自然人  2005.0  9670.0     工业  1.0  0.0   \n",
       "693.0       1.0   股份有限公司  山东     0.98  企业法人  2011.0  8360.0   社区服务  0.0  0.0   \n",
       "727.0       1.0   股份有限公司  江西     0.54  企业法人  2001.0  8720.0    零售业  0.0  0.0   \n",
       "990.0       1.0  集体所有制企业  广西     0.75   自然人  2014.0  8440.0   社区服务  0.0  0.0   \n",
       "...         ...      ...  ..      ...   ...     ...     ...    ...  ...  ...   \n",
       "5999994.0   0.0   股份有限公司  湖南     0.65  企业法人  2011.0  2960.0  商业服务业  0.0  0.0   \n",
       "5999995.0   0.0     合伙企业  湖南     0.83  企业法人  2000.0  9650.0     工业  0.0  1.0   \n",
       "5999996.0   0.0  农民专业合作社  湖北     0.93   自然人  2011.0  2170.0    零售业  1.0  1.0   \n",
       "5999997.0   0.0  集体所有制企业  福建     0.73  企业法人  2013.0  9030.0  交通运输业  1.0  1.0   \n",
       "5999999.0   0.0   股份有限公司  福建     0.80   自然人  2014.0  9130.0  交通运输业  1.0  1.0   \n",
       "\n",
       "           ...  项目融资和政策融资成本   从业人数      资产总额      负债总额      营业总收入    主营业务收入  \\\n",
       "ID         ...                                                                \n",
       "230.0      ...          0.0  365.0   53760.0   50400.0   155904.0  124723.2   \n",
       "429.0      ...          0.0  678.0  531850.0  783270.0  1329625.0  531850.0   \n",
       "693.0      ...          0.0  366.0   41800.0   66880.0   183920.0   91960.0   \n",
       "727.0      ...          0.0  872.0  130800.0  183120.0   483960.0  241980.0   \n",
       "990.0      ...          0.0  177.0   16880.0    4220.0    75960.0   30384.0   \n",
       "...        ...          ...    ...       ...       ...        ...       ...   \n",
       "5999994.0  ...          0.0  163.0   14800.0   11840.0    22200.0   11100.0   \n",
       "5999995.0  ...          0.0  528.0  154400.0  144750.0   293360.0  234688.0   \n",
       "5999996.0  ...          0.0  473.0   32550.0   45570.0    39060.0   31248.0   \n",
       "5999997.0  ...          0.0  356.0   81270.0   36120.0   398223.0  199111.5   \n",
       "5999999.0  ...          0.0  933.0   73040.0   95865.0    51128.0   25564.0   \n",
       "\n",
       "               利润总额       净利润      纳税总额   所有者权益合计  \n",
       "ID                                                 \n",
       "230.0       46771.2  -15590.4       0.0    3360.0  \n",
       "429.0      132962.5 -132962.5       0.0 -251420.0  \n",
       "693.0       36784.0  -18392.0       0.0  -25080.0  \n",
       "727.0       48396.0  -48396.0       0.0  -52320.0  \n",
       "990.0        7596.0   -7596.0       0.0   12660.0  \n",
       "...             ...       ...       ...       ...  \n",
       "5999994.0    8880.0    8880.0    8880.0    2960.0  \n",
       "5999995.0  146680.0   58672.0  176016.0    9650.0  \n",
       "5999996.0   11718.0    3906.0   23436.0  -13020.0  \n",
       "5999997.0  199111.5  159289.2  238933.8   45150.0  \n",
       "5999999.0    5112.8       0.0   10225.6  -22825.0  \n",
       "\n",
       "[26951 rows x 29 columns]"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    },
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>flag</th>\n",
       "      <th>企业类型</th>\n",
       "      <th>区域</th>\n",
       "      <th>控制人持股比例</th>\n",
       "      <th>控制人类型</th>\n",
       "      <th>注册时间</th>\n",
       "      <th>注册资本</th>\n",
       "      <th>行业</th>\n",
       "      <th>专利</th>\n",
       "      <th>商标</th>\n",
       "      <th>...</th>\n",
       "      <th>项目融资和政策融资成本</th>\n",
       "      <th>从业人数</th>\n",
       "      <th>资产总额</th>\n",
       "      <th>负债总额</th>\n",
       "      <th>营业总收入</th>\n",
       "      <th>主营业务收入</th>\n",
       "      <th>利润总额</th>\n",
       "      <th>净利润</th>\n",
       "      <th>纳税总额</th>\n",
       "      <th>所有者权益合计</th>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>ID</th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th>230.0</th>\n",
       "      <td>1.0</td>\n",
       "      <td>农民专业合作社</td>\n",
       "      <td>广东</td>\n",
       "      <td>1.00</td>\n",
       "      <td>企业法人</td>\n",
       "      <td>2008.0</td>\n",
       "      <td>3360.0</td>\n",
       "      <td>服务业</td>\n",
       "      <td>0.0</td>\n",
       "      <td>0.0</td>\n",
       "      <td>...</td>\n",
       "      <td>0.000</td>\n",
       "      <td>592.0</td>\n",
       "      <td>151200.0</td>\n",
       "      <td>221760.0</td>\n",
       "      <td>30240.0</td>\n",
       "      <td>15120.0</td>\n",
       "      <td>15120.0</td>\n",
       "      <td>-3024.0</td>\n",
       "      <td>0.0</td>\n",
       "      <td>-70560.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>429.0</th>\n",
       "      <td>1.0</td>\n",
       "      <td>集体所有制企业</td>\n",
       "      <td>江西</td>\n",
       "      <td>0.75</td>\n",
       "      <td>自然人</td>\n",
       "      <td>2005.0</td>\n",
       "      <td>9670.0</td>\n",
       "      <td>工业</td>\n",
       "      <td>1.0</td>\n",
       "      <td>0.0</td>\n",
       "      <td>...</td>\n",
       "      <td>0.000</td>\n",
       "      <td>532.0</td>\n",
       "      <td>348120.0</td>\n",
       "      <td>338450.0</td>\n",
       "      <td>1322856.0</td>\n",
       "      <td>925999.2</td>\n",
       "      <td>396856.8</td>\n",
       "      <td>-132285.6</td>\n",
       "      <td>0.0</td>\n",
       "      <td>9670.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>727.0</th>\n",
       "      <td>1.0</td>\n",
       "      <td>股份有限公司</td>\n",
       "      <td>江西</td>\n",
       "      <td>0.54</td>\n",
       "      <td>企业法人</td>\n",
       "      <td>2001.0</td>\n",
       "      <td>8720.0</td>\n",
       "      <td>零售业</td>\n",
       "      <td>0.0</td>\n",
       "      <td>0.0</td>\n",
       "      <td>...</td>\n",
       "      <td>0.000</td>\n",
       "      <td>584.0</td>\n",
       "      <td>697600.0</td>\n",
       "      <td>1033320.0</td>\n",
       "      <td>2511360.0</td>\n",
       "      <td>1004544.0</td>\n",
       "      <td>502272.0</td>\n",
       "      <td>-251136.0</td>\n",
       "      <td>0.0</td>\n",
       "      <td>-335720.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>990.0</th>\n",
       "      <td>1.0</td>\n",
       "      <td>集体所有制企业</td>\n",
       "      <td>广西</td>\n",
       "      <td>0.75</td>\n",
       "      <td>自然人</td>\n",
       "      <td>2014.0</td>\n",
       "      <td>8440.0</td>\n",
       "      <td>社区服务</td>\n",
       "      <td>0.0</td>\n",
       "      <td>0.0</td>\n",
       "      <td>...</td>\n",
       "      <td>0.000</td>\n",
       "      <td>880.0</td>\n",
       "      <td>75960.0</td>\n",
       "      <td>101280.0</td>\n",
       "      <td>372204.0</td>\n",
       "      <td>260542.8</td>\n",
       "      <td>37220.4</td>\n",
       "      <td>-37220.4</td>\n",
       "      <td>0.0</td>\n",
       "      <td>-25320.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1137.0</th>\n",
       "      <td>1.0</td>\n",
       "      <td>有限责任公司</td>\n",
       "      <td>广东</td>\n",
       "      <td>0.83</td>\n",
       "      <td>企业法人</td>\n",
       "      <td>2002.0</td>\n",
       "      <td>2240.0</td>\n",
       "      <td>商业服务业</td>\n",
       "      <td>0.0</td>\n",
       "      <td>0.0</td>\n",
       "      <td>...</td>\n",
       "      <td>60.480</td>\n",
       "      <td>215.0</td>\n",
       "      <td>100800.0</td>\n",
       "      <td>147840.0</td>\n",
       "      <td>80640.0</td>\n",
       "      <td>32256.0</td>\n",
       "      <td>40320.0</td>\n",
       "      <td>-8064.0</td>\n",
       "      <td>0.0</td>\n",
       "      <td>-47040.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>...</th>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>5999995.0</th>\n",
       "      <td>0.0</td>\n",
       "      <td>合伙企业</td>\n",
       "      <td>湖南</td>\n",
       "      <td>0.83</td>\n",
       "      <td>企业法人</td>\n",
       "      <td>2000.0</td>\n",
       "      <td>9650.0</td>\n",
       "      <td>工业</td>\n",
       "      <td>0.0</td>\n",
       "      <td>1.0</td>\n",
       "      <td>...</td>\n",
       "      <td>0.000</td>\n",
       "      <td>823.0</td>\n",
       "      <td>820250.0</td>\n",
       "      <td>405300.0</td>\n",
       "      <td>902275.0</td>\n",
       "      <td>631592.5</td>\n",
       "      <td>451137.5</td>\n",
       "      <td>0.0</td>\n",
       "      <td>541365.0</td>\n",
       "      <td>414950.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>5999996.0</th>\n",
       "      <td>0.0</td>\n",
       "      <td>农民专业合作社</td>\n",
       "      <td>湖北</td>\n",
       "      <td>0.93</td>\n",
       "      <td>自然人</td>\n",
       "      <td>2011.0</td>\n",
       "      <td>2170.0</td>\n",
       "      <td>零售业</td>\n",
       "      <td>1.0</td>\n",
       "      <td>1.0</td>\n",
       "      <td>...</td>\n",
       "      <td>0.000</td>\n",
       "      <td>803.0</td>\n",
       "      <td>13020.0</td>\n",
       "      <td>5425.0</td>\n",
       "      <td>49476.0</td>\n",
       "      <td>19790.4</td>\n",
       "      <td>19790.4</td>\n",
       "      <td>19790.4</td>\n",
       "      <td>19790.4</td>\n",
       "      <td>7595.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>5999997.0</th>\n",
       "      <td>0.0</td>\n",
       "      <td>集体所有制企业</td>\n",
       "      <td>福建</td>\n",
       "      <td>0.73</td>\n",
       "      <td>企业法人</td>\n",
       "      <td>2013.0</td>\n",
       "      <td>9030.0</td>\n",
       "      <td>交通运输业</td>\n",
       "      <td>1.0</td>\n",
       "      <td>1.0</td>\n",
       "      <td>...</td>\n",
       "      <td>0.000</td>\n",
       "      <td>76.0</td>\n",
       "      <td>144480.0</td>\n",
       "      <td>203175.0</td>\n",
       "      <td>390096.0</td>\n",
       "      <td>234057.6</td>\n",
       "      <td>39009.6</td>\n",
       "      <td>0.0</td>\n",
       "      <td>156038.4</td>\n",
       "      <td>-58695.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>5999998.0</th>\n",
       "      <td>0.0</td>\n",
       "      <td>股份有限公司</td>\n",
       "      <td>湖南</td>\n",
       "      <td>0.64</td>\n",
       "      <td>自然人</td>\n",
       "      <td>2014.0</td>\n",
       "      <td>4510.0</td>\n",
       "      <td>服务业</td>\n",
       "      <td>0.0</td>\n",
       "      <td>0.0</td>\n",
       "      <td>...</td>\n",
       "      <td>0.000</td>\n",
       "      <td>841.0</td>\n",
       "      <td>67650.0</td>\n",
       "      <td>63140.0</td>\n",
       "      <td>60885.0</td>\n",
       "      <td>30442.5</td>\n",
       "      <td>30442.5</td>\n",
       "      <td>-6088.5</td>\n",
       "      <td>0.0</td>\n",
       "      <td>4510.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>5999999.0</th>\n",
       "      <td>0.0</td>\n",
       "      <td>股份有限公司</td>\n",
       "      <td>福建</td>\n",
       "      <td>0.80</td>\n",
       "      <td>自然人</td>\n",
       "      <td>2014.0</td>\n",
       "      <td>9130.0</td>\n",
       "      <td>交通运输业</td>\n",
       "      <td>1.0</td>\n",
       "      <td>1.0</td>\n",
       "      <td>...</td>\n",
       "      <td>49.302</td>\n",
       "      <td>46.0</td>\n",
       "      <td>82170.0</td>\n",
       "      <td>73040.0</td>\n",
       "      <td>16434.0</td>\n",
       "      <td>11503.8</td>\n",
       "      <td>8217.0</td>\n",
       "      <td>6573.6</td>\n",
       "      <td>9860.4</td>\n",
       "      <td>9130.0</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "<p>26985 rows × 29 columns</p>\n",
       "</div>"
      ],
      "text/plain": [
       "           flag     企业类型  区域  控制人持股比例 控制人类型    注册时间    注册资本     行业   专利   商标  \\\n",
       "ID                                                                             \n",
       "230.0       1.0  农民专业合作社  广东     1.00  企业法人  2008.0  3360.0    服务业  0.0  0.0   \n",
       "429.0       1.0  集体所有制企业  江西     0.75   自然人  2005.0  9670.0     工业  1.0  0.0   \n",
       "727.0       1.0   股份有限公司  江西     0.54  企业法人  2001.0  8720.0    零售业  0.0  0.0   \n",
       "990.0       1.0  集体所有制企业  广西     0.75   自然人  2014.0  8440.0   社区服务  0.0  0.0   \n",
       "1137.0      1.0   有限责任公司  广东     0.83  企业法人  2002.0  2240.0  商业服务业  0.0  0.0   \n",
       "...         ...      ...  ..      ...   ...     ...     ...    ...  ...  ...   \n",
       "5999995.0   0.0     合伙企业  湖南     0.83  企业法人  2000.0  9650.0     工业  0.0  1.0   \n",
       "5999996.0   0.0  农民专业合作社  湖北     0.93   自然人  2011.0  2170.0    零售业  1.0  1.0   \n",
       "5999997.0   0.0  集体所有制企业  福建     0.73  企业法人  2013.0  9030.0  交通运输业  1.0  1.0   \n",
       "5999998.0   0.0   股份有限公司  湖南     0.64   自然人  2014.0  4510.0    服务业  0.0  0.0   \n",
       "5999999.0   0.0   股份有限公司  福建     0.80   自然人  2014.0  9130.0  交通运输业  1.0  1.0   \n",
       "\n",
       "           ...  项目融资和政策融资成本   从业人数      资产总额       负债总额      营业总收入     主营业务收入  \\\n",
       "ID         ...                                                                  \n",
       "230.0      ...        0.000  592.0  151200.0   221760.0    30240.0    15120.0   \n",
       "429.0      ...        0.000  532.0  348120.0   338450.0  1322856.0   925999.2   \n",
       "727.0      ...        0.000  584.0  697600.0  1033320.0  2511360.0  1004544.0   \n",
       "990.0      ...        0.000  880.0   75960.0   101280.0   372204.0   260542.8   \n",
       "1137.0     ...       60.480  215.0  100800.0   147840.0    80640.0    32256.0   \n",
       "...        ...          ...    ...       ...        ...        ...        ...   \n",
       "5999995.0  ...        0.000  823.0  820250.0   405300.0   902275.0   631592.5   \n",
       "5999996.0  ...        0.000  803.0   13020.0     5425.0    49476.0    19790.4   \n",
       "5999997.0  ...        0.000   76.0  144480.0   203175.0   390096.0   234057.6   \n",
       "5999998.0  ...        0.000  841.0   67650.0    63140.0    60885.0    30442.5   \n",
       "5999999.0  ...       49.302   46.0   82170.0    73040.0    16434.0    11503.8   \n",
       "\n",
       "               利润总额       净利润      纳税总额   所有者权益合计  \n",
       "ID                                                 \n",
       "230.0       15120.0   -3024.0       0.0  -70560.0  \n",
       "429.0      396856.8 -132285.6       0.0    9670.0  \n",
       "727.0      502272.0 -251136.0       0.0 -335720.0  \n",
       "990.0       37220.4  -37220.4       0.0  -25320.0  \n",
       "1137.0      40320.0   -8064.0       0.0  -47040.0  \n",
       "...             ...       ...       ...       ...  \n",
       "5999995.0  451137.5       0.0  541365.0  414950.0  \n",
       "5999996.0   19790.4   19790.4   19790.4    7595.0  \n",
       "5999997.0   39009.6       0.0  156038.4  -58695.0  \n",
       "5999998.0   30442.5   -6088.5       0.0    4510.0  \n",
       "5999999.0    8217.0    6573.6    9860.4    9130.0  \n",
       "\n",
       "[26985 rows x 29 columns]"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    }
   ],
   "source": [
    "p2015 = pd.concat([no_year, peo__2015], axis=1, sort=True)\n",
    "p2015.dropna()\n",
    "p2016 = pd.concat([no_year, peo__2016], axis=1, sort=True)\n",
    "p2015.dropna()\n",
    "p2017 = pd.concat([no_year, peo__2017], axis=1, sort=True)\n",
    "p2015.dropna()\n",
    "a=p2015.dropna()\n",
    "b=p2016.dropna()\n",
    "c=p2017.dropna()\n",
    "display(a,b,c)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 39,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "509.1573108287502"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    },
    {
     "data": {
      "text/plain": [
       "508.7570137450574"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    },
    {
     "data": {
      "text/plain": [
       "511.30648790549407"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    },
    {
     "data": {
      "text/plain": [
       "510.5645704488396"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    },
    {
     "data": {
      "text/plain": [
       "511.94378100312326"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    },
    {
     "data": {
      "text/plain": [
       "507.83087198970526"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    }
   ],
   "source": [
    "y_2015=a[a['flag']==1]\n",
    "n_2015=a[a['flag']==0]\n",
    "y_2016=b[b['flag']==1]\n",
    "n_2016=b[b['flag']==0]\n",
    "y_2017=c[c['flag']==1]\n",
    "n_2017=c[c['flag']==0]\n",
    "display(y_2015['从业人数'].mean(),y_2016['从业人数'].mean(),y_2017['从业人数'].mean())\n",
    "display(n_2015['从业人数'].mean(),n_2016['从业人数'].mean(),n_2017['从业人数'].mean())"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 5,
   "metadata": {},
   "outputs": [],
   "source": [
    "from preprocess_data import Process "
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [],
   "source": []
  },
  {
   "cell_type": "code",
   "execution_count": 22,
   "metadata": {},
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "<class 'pandas.core.frame.DataFrame'>\n",
      "Float64Index: 35648 entries, 28.0 to 5999999.0\n",
      "Data columns (total 7 columns):\n",
      "flag     35648 non-null float64\n",
      "纳税总额     35648 non-null float64\n",
      "净利润      35648 non-null float64\n",
      "注册资本     35648 non-null float64\n",
      "负债总额     35648 non-null float64\n",
      "从业人数     35648 non-null float64\n",
      "营业总收入    35648 non-null float64\n",
      "dtypes: float64(7)\n",
      "memory usage: 2.2 MB\n",
      "None\n",
      "           flag           纳税总额            净利润    注册资本           负债总额  \\\n",
      "ID                                                                     \n",
      "28.0        1.0       0.000000  -19707.333333  2050.0   86783.333333   \n",
      "230.0       1.0       0.000000  -10046.400000  3360.0   94080.000000   \n",
      "429.0       1.0       0.000000 -105177.366667  9670.0  435150.000000   \n",
      "693.0       1.0       0.000000  -27978.133333  8360.0   64093.333333   \n",
      "727.0       1.0       0.000000 -113272.800000  8720.0  584240.000000   \n",
      "...         ...            ...            ...     ...            ...   \n",
      "5999995.0   0.0  286412.000000   43199.833333  9650.0  250900.000000   \n",
      "5999996.0   0.0   17649.333333    9519.066667  2170.0   19168.333333   \n",
      "5999997.0   0.0  211121.400000   79584.400000  9030.0  106855.000000   \n",
      "5999998.0   0.0   10433.133333    7862.433333  4510.0   33825.000000   \n",
      "5999999.0   0.0   14729.733333    4199.800000  9130.0   59345.000000   \n",
      "\n",
      "                 从业人数         营业总收入  \n",
      "ID                                   \n",
      "28.0       527.666667  1.970733e+05  \n",
      "230.0      480.666667  1.004640e+05  \n",
      "429.0      448.666667  1.051774e+06  \n",
      "693.0      300.000000  2.797813e+05  \n",
      "727.0      610.333333  1.132728e+06  \n",
      "...               ...           ...  \n",
      "5999995.0  500.333333  6.349700e+05  \n",
      "5999996.0  703.666667  3.761333e+04  \n",
      "5999997.0  264.666667  3.952130e+05  \n",
      "5999998.0  723.000000  6.975467e+04  \n",
      "5999999.0  621.333333  4.260667e+04  \n",
      "\n",
      "[35648 rows x 7 columns]\n"
     ]
    }
   ],
   "source": [
    "base_train_sum = r'./data/base_train_sum.csv'\n",
    "base_varify = r'./data/base_verify1.csv'\n",
    "knowledge_train = r'./data/knowledge_train_sum.csv'\n",
    "paient_information_verify1 = r'./data/paient_information_verify1.csv'\n",
    "\n",
    "money_report_train_sum = r'./data/money_report_train_sum.csv'\n",
    "money_information_verify1 = r'./data/money_information_verify1.csv'\n",
    "year_report_train_sum = r'./data/year_report_train_sum.csv'\n",
    "year_report_verify1 = r'./data/year_report_verify1.csv'\n",
    "# base_varify = r'./temp_data/base_verify1.csv'\n",
    "# paient_information_verify1 = r'./temp_data/paient_information_verify1.csv'\n",
    "# money_information_verify1 = r'./temp_data/money_information_verify1.csv'\n",
    "# year_report_verify1 = r'./temp_data/year_report_verify1.csv'\n",
    "\n",
    "p = Process(base_train_sum, knowledge_train, money_report_train_sum, year_report_train_sum,standard=False, features=6)\n",
    "\n",
    "res = p.alpha_process_csv(base_varify, paient_information_verify1, money_information_verify1, year_report_verify1)\n",
    "# res = p.beta_process_csv()\n",
    "print(res.info())\n",
    "print(res)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 24,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>flag</th>\n",
       "      <th>纳税总额</th>\n",
       "      <th>净利润</th>\n",
       "      <th>注册资本</th>\n",
       "      <th>负债总额</th>\n",
       "      <th>从业人数</th>\n",
       "      <th>营业总收入</th>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>ID</th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th>28.0</th>\n",
       "      <td>1.0</td>\n",
       "      <td>0.0</td>\n",
       "      <td>-19707.333333</td>\n",
       "      <td>2050.0</td>\n",
       "      <td>86783.333333</td>\n",
       "      <td>527.666667</td>\n",
       "      <td>1.970733e+05</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>230.0</th>\n",
       "      <td>1.0</td>\n",
       "      <td>0.0</td>\n",
       "      <td>-10046.400000</td>\n",
       "      <td>3360.0</td>\n",
       "      <td>94080.000000</td>\n",
       "      <td>480.666667</td>\n",
       "      <td>1.004640e+05</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>429.0</th>\n",
       "      <td>1.0</td>\n",
       "      <td>0.0</td>\n",
       "      <td>-105177.366667</td>\n",
       "      <td>9670.0</td>\n",
       "      <td>435150.000000</td>\n",
       "      <td>448.666667</td>\n",
       "      <td>1.051774e+06</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>693.0</th>\n",
       "      <td>1.0</td>\n",
       "      <td>0.0</td>\n",
       "      <td>-27978.133333</td>\n",
       "      <td>8360.0</td>\n",
       "      <td>64093.333333</td>\n",
       "      <td>300.000000</td>\n",
       "      <td>2.797813e+05</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>727.0</th>\n",
       "      <td>1.0</td>\n",
       "      <td>0.0</td>\n",
       "      <td>-113272.800000</td>\n",
       "      <td>8720.0</td>\n",
       "      <td>584240.000000</td>\n",
       "      <td>610.333333</td>\n",
       "      <td>1.132728e+06</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>...</th>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>3449274.0</th>\n",
       "      <td>1.0</td>\n",
       "      <td>0.0</td>\n",
       "      <td>-103416.000000</td>\n",
       "      <td>7440.0</td>\n",
       "      <td>249240.000000</td>\n",
       "      <td>734.333333</td>\n",
       "      <td>1.034160e+06</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>3449645.0</th>\n",
       "      <td>1.0</td>\n",
       "      <td>0.0</td>\n",
       "      <td>-9997.000000</td>\n",
       "      <td>1950.0</td>\n",
       "      <td>30875.000000</td>\n",
       "      <td>559.000000</td>\n",
       "      <td>9.997000e+04</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>3449900.0</th>\n",
       "      <td>1.0</td>\n",
       "      <td>0.0</td>\n",
       "      <td>-12206.466667</td>\n",
       "      <td>2770.0</td>\n",
       "      <td>177741.666667</td>\n",
       "      <td>593.333333</td>\n",
       "      <td>1.220647e+05</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>3449919.0</th>\n",
       "      <td>1.0</td>\n",
       "      <td>0.0</td>\n",
       "      <td>-12608.400000</td>\n",
       "      <td>7980.0</td>\n",
       "      <td>51870.000000</td>\n",
       "      <td>439.666667</td>\n",
       "      <td>1.260840e+05</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>3449944.0</th>\n",
       "      <td>1.0</td>\n",
       "      <td>0.0</td>\n",
       "      <td>-9153.200000</td>\n",
       "      <td>5880.0</td>\n",
       "      <td>26460.000000</td>\n",
       "      <td>656.333333</td>\n",
       "      <td>9.153200e+04</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "<p>13999 rows × 7 columns</p>\n",
       "</div>"
      ],
      "text/plain": [
       "           flag  纳税总额            净利润    注册资本           负债总额        从业人数  \\\n",
       "ID                                                                        \n",
       "28.0        1.0   0.0  -19707.333333  2050.0   86783.333333  527.666667   \n",
       "230.0       1.0   0.0  -10046.400000  3360.0   94080.000000  480.666667   \n",
       "429.0       1.0   0.0 -105177.366667  9670.0  435150.000000  448.666667   \n",
       "693.0       1.0   0.0  -27978.133333  8360.0   64093.333333  300.000000   \n",
       "727.0       1.0   0.0 -113272.800000  8720.0  584240.000000  610.333333   \n",
       "...         ...   ...            ...     ...            ...         ...   \n",
       "3449274.0   1.0   0.0 -103416.000000  7440.0  249240.000000  734.333333   \n",
       "3449645.0   1.0   0.0   -9997.000000  1950.0   30875.000000  559.000000   \n",
       "3449900.0   1.0   0.0  -12206.466667  2770.0  177741.666667  593.333333   \n",
       "3449919.0   1.0   0.0  -12608.400000  7980.0   51870.000000  439.666667   \n",
       "3449944.0   1.0   0.0   -9153.200000  5880.0   26460.000000  656.333333   \n",
       "\n",
       "                  营业总收入  \n",
       "ID                       \n",
       "28.0       1.970733e+05  \n",
       "230.0      1.004640e+05  \n",
       "429.0      1.051774e+06  \n",
       "693.0      2.797813e+05  \n",
       "727.0      1.132728e+06  \n",
       "...                 ...  \n",
       "3449274.0  1.034160e+06  \n",
       "3449645.0  9.997000e+04  \n",
       "3449900.0  1.220647e+05  \n",
       "3449919.0  1.260840e+05  \n",
       "3449944.0  9.153200e+04  \n",
       "\n",
       "[13999 rows x 7 columns]"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    },
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>flag</th>\n",
       "      <th>纳税总额</th>\n",
       "      <th>净利润</th>\n",
       "      <th>注册资本</th>\n",
       "      <th>负债总额</th>\n",
       "      <th>从业人数</th>\n",
       "      <th>营业总收入</th>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>ID</th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th>5978034.0</th>\n",
       "      <td>0.0</td>\n",
       "      <td>63541.333333</td>\n",
       "      <td>52584.000000</td>\n",
       "      <td>5600.000000</td>\n",
       "      <td>66266.666667</td>\n",
       "      <td>746.333333</td>\n",
       "      <td>189093.333333</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>5978036.0</th>\n",
       "      <td>0.0</td>\n",
       "      <td>85702.666667</td>\n",
       "      <td>47760.000000</td>\n",
       "      <td>7960.000000</td>\n",
       "      <td>149913.333333</td>\n",
       "      <td>459.666667</td>\n",
       "      <td>266660.000000</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>5978037.0</th>\n",
       "      <td>0.0</td>\n",
       "      <td>57772.333333</td>\n",
       "      <td>28776.333333</td>\n",
       "      <td>6590.000000</td>\n",
       "      <td>65900.000000</td>\n",
       "      <td>187.666667</td>\n",
       "      <td>143881.666667</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>5978038.0</th>\n",
       "      <td>0.0</td>\n",
       "      <td>64711.333333</td>\n",
       "      <td>66896.000000</td>\n",
       "      <td>5650.000000</td>\n",
       "      <td>68741.666667</td>\n",
       "      <td>784.333333</td>\n",
       "      <td>235040.000000</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>5978039.0</th>\n",
       "      <td>0.0</td>\n",
       "      <td>88179.000000</td>\n",
       "      <td>14756.000000</td>\n",
       "      <td>5023.133934</td>\n",
       "      <td>86275.000000</td>\n",
       "      <td>539.666667</td>\n",
       "      <td>179095.000000</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>...</th>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>5999995.0</th>\n",
       "      <td>0.0</td>\n",
       "      <td>286412.000000</td>\n",
       "      <td>43199.833333</td>\n",
       "      <td>9650.000000</td>\n",
       "      <td>250900.000000</td>\n",
       "      <td>500.333333</td>\n",
       "      <td>634970.000000</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>5999996.0</th>\n",
       "      <td>0.0</td>\n",
       "      <td>17649.333333</td>\n",
       "      <td>9519.066667</td>\n",
       "      <td>2170.000000</td>\n",
       "      <td>19168.333333</td>\n",
       "      <td>703.666667</td>\n",
       "      <td>37613.333333</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>5999997.0</th>\n",
       "      <td>0.0</td>\n",
       "      <td>211121.400000</td>\n",
       "      <td>79584.400000</td>\n",
       "      <td>9030.000000</td>\n",
       "      <td>106855.000000</td>\n",
       "      <td>264.666667</td>\n",
       "      <td>395213.000000</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>5999998.0</th>\n",
       "      <td>0.0</td>\n",
       "      <td>10433.133333</td>\n",
       "      <td>7862.433333</td>\n",
       "      <td>4510.000000</td>\n",
       "      <td>33825.000000</td>\n",
       "      <td>723.000000</td>\n",
       "      <td>69754.666667</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>5999999.0</th>\n",
       "      <td>0.0</td>\n",
       "      <td>14729.733333</td>\n",
       "      <td>4199.800000</td>\n",
       "      <td>9130.000000</td>\n",
       "      <td>59345.000000</td>\n",
       "      <td>621.333333</td>\n",
       "      <td>42606.666667</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "<p>21649 rows × 7 columns</p>\n",
       "</div>"
      ],
      "text/plain": [
       "           flag           纳税总额           净利润         注册资本           负债总额  \\\n",
       "ID                                                                         \n",
       "5978034.0   0.0   63541.333333  52584.000000  5600.000000   66266.666667   \n",
       "5978036.0   0.0   85702.666667  47760.000000  7960.000000  149913.333333   \n",
       "5978037.0   0.0   57772.333333  28776.333333  6590.000000   65900.000000   \n",
       "5978038.0   0.0   64711.333333  66896.000000  5650.000000   68741.666667   \n",
       "5978039.0   0.0   88179.000000  14756.000000  5023.133934   86275.000000   \n",
       "...         ...            ...           ...          ...            ...   \n",
       "5999995.0   0.0  286412.000000  43199.833333  9650.000000  250900.000000   \n",
       "5999996.0   0.0   17649.333333   9519.066667  2170.000000   19168.333333   \n",
       "5999997.0   0.0  211121.400000  79584.400000  9030.000000  106855.000000   \n",
       "5999998.0   0.0   10433.133333   7862.433333  4510.000000   33825.000000   \n",
       "5999999.0   0.0   14729.733333   4199.800000  9130.000000   59345.000000   \n",
       "\n",
       "                 从业人数          营业总收入  \n",
       "ID                                    \n",
       "5978034.0  746.333333  189093.333333  \n",
       "5978036.0  459.666667  266660.000000  \n",
       "5978037.0  187.666667  143881.666667  \n",
       "5978038.0  784.333333  235040.000000  \n",
       "5978039.0  539.666667  179095.000000  \n",
       "...               ...            ...  \n",
       "5999995.0  500.333333  634970.000000  \n",
       "5999996.0  703.666667   37613.333333  \n",
       "5999997.0  264.666667  395213.000000  \n",
       "5999998.0  723.000000   69754.666667  \n",
       "5999999.0  621.333333   42606.666667  \n",
       "\n",
       "[21649 rows x 7 columns]"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    }
   ],
   "source": [
    "y_flag_peo = res[res['flag']==1]\n",
    "n_flag_peo = res[res['flag']==0]\n",
    "display(y_flag_peo,n_flag_peo)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 28,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "count    13999.000000\n",
       "mean       498.806248\n",
       "std        167.810568\n",
       "min         20.333333\n",
       "25%        381.000000\n",
       "50%        497.666667\n",
       "75%        617.833333\n",
       "max        963.000000\n",
       "Name: 从业人数, dtype: float64"
      ]
     },
     "execution_count": 28,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "y_flag_peo['从业人数'].describe()"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 26,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "Counter({746.3333333333334: 10,\n",
       "         459.6666666666667: 15,\n",
       "         187.66666666666666: 6,\n",
       "         784.3333333333334: 3,\n",
       "         539.6666666666666: 18,\n",
       "         407.0: 14,\n",
       "         753.0: 6,\n",
       "         411.0: 14,\n",
       "         650.3333333333334: 9,\n",
       "         914.6666666666666: 1,\n",
       "         593.3333333333334: 14,\n",
       "         425.3333333333333: 14,\n",
       "         305.0: 7,\n",
       "         747.6666666666666: 8,\n",
       "         597.3333333333334: 10,\n",
       "         571.6666666666666: 17,\n",
       "         356.3333333333333: 13,\n",
       "         345.3333333333333: 13,\n",
       "         592.0: 16,\n",
       "         823.6666666666666: 4,\n",
       "         204.0: 3,\n",
       "         528.0: 17,\n",
       "         506.6666666666667: 14,\n",
       "         881.3333333333334: 1,\n",
       "         561.0: 21,\n",
       "         493.0: 12,\n",
       "         458.6666666666667: 13,\n",
       "         596.0: 24,\n",
       "         435.0: 18,\n",
       "         600.6666666666666: 18,\n",
       "         344.3333333333333: 11,\n",
       "         257.6666666666667: 7,\n",
       "         713.3333333333334: 12,\n",
       "         603.3333333333334: 16,\n",
       "         799.6666666666666: 2,\n",
       "         521.6666666666666: 20,\n",
       "         367.6666666666667: 9,\n",
       "         472.6666666666667: 16,\n",
       "         306.3333333333333: 12,\n",
       "         202.33333333333334: 2,\n",
       "         468.6666666666667: 11,\n",
       "         523.3333333333334: 9,\n",
       "         263.3333333333333: 4,\n",
       "         368.3333333333333: 9,\n",
       "         466.3333333333333: 12,\n",
       "         685.3333333333334: 8,\n",
       "         814.3333333333334: 3,\n",
       "         413.3333333333333: 17,\n",
       "         494.6666666666667: 15,\n",
       "         505.6666666666667: 22,\n",
       "         243.0: 9,\n",
       "         628.3333333333334: 18,\n",
       "         675.0: 14,\n",
       "         337.6666666666667: 11,\n",
       "         590.0: 16,\n",
       "         140.66666666666666: 2,\n",
       "         385.3333333333333: 14,\n",
       "         522.3333333333334: 14,\n",
       "         465.3333333333333: 18,\n",
       "         630.6666666666666: 17,\n",
       "         445.3333333333333: 20,\n",
       "         391.0: 10,\n",
       "         531.6666666666666: 24,\n",
       "         406.6666666666667: 20,\n",
       "         261.3333333333333: 7,\n",
       "         728.3333333333334: 8,\n",
       "         732.3333333333334: 9,\n",
       "         471.6666666666667: 11,\n",
       "         424.6666666666667: 19,\n",
       "         623.3333333333334: 10,\n",
       "         518.0: 24,\n",
       "         333.3333333333333: 8,\n",
       "         491.0: 14,\n",
       "         840.6666666666666: 3,\n",
       "         574.6666666666666: 20,\n",
       "         343.0: 13,\n",
       "         374.3333333333333: 5,\n",
       "         447.0: 20,\n",
       "         441.3333333333333: 16,\n",
       "         375.0: 14,\n",
       "         348.3333333333333: 14,\n",
       "         759.3333333333334: 7,\n",
       "         479.0: 13,\n",
       "         366.6666666666667: 14,\n",
       "         253.66666666666666: 9,\n",
       "         417.0: 14,\n",
       "         547.6666666666666: 25,\n",
       "         460.0: 12,\n",
       "         421.3333333333333: 11,\n",
       "         615.6666666666666: 11,\n",
       "         362.6666666666667: 16,\n",
       "         321.6666666666667: 15,\n",
       "         467.3333333333333: 17,\n",
       "         354.6666666666667: 8,\n",
       "         433.0: 20,\n",
       "         499.0: 14,\n",
       "         765.0: 4,\n",
       "         349.0: 11,\n",
       "         296.0: 12,\n",
       "         492.0: 20,\n",
       "         377.0: 18,\n",
       "         451.0: 19,\n",
       "         542.3333333333334: 11,\n",
       "         659.3333333333334: 16,\n",
       "         591.0: 16,\n",
       "         321.3333333333333: 13,\n",
       "         511.6666666666667: 18,\n",
       "         193.0: 9,\n",
       "         695.0: 13,\n",
       "         830.6666666666666: 5,\n",
       "         921.3333333333334: 2,\n",
       "         311.3333333333333: 9,\n",
       "         559.6666666666666: 13,\n",
       "         611.3333333333334: 13,\n",
       "         662.0: 10,\n",
       "         184.66666666666666: 7,\n",
       "         562.3333333333334: 18,\n",
       "         225.0: 7,\n",
       "         577.0: 11,\n",
       "         631.6666666666666: 14,\n",
       "         640.0: 10,\n",
       "         419.3333333333333: 13,\n",
       "         355.0: 10,\n",
       "         484.3333333333333: 28,\n",
       "         128.33333333333334: 3,\n",
       "         545.6666666666666: 19,\n",
       "         862.0: 2,\n",
       "         767.3333333333334: 5,\n",
       "         330.6666666666667: 9,\n",
       "         555.6666666666666: 14,\n",
       "         182.33333333333334: 3,\n",
       "         855.3333333333334: 1,\n",
       "         287.3333333333333: 6,\n",
       "         178.0: 7,\n",
       "         369.3333333333333: 13,\n",
       "         419.0: 15,\n",
       "         479.6666666666667: 11,\n",
       "         256.3333333333333: 7,\n",
       "         498.6666666666667: 19,\n",
       "         399.3333333333333: 16,\n",
       "         316.3333333333333: 11,\n",
       "         505.0: 19,\n",
       "         536.3333333333334: 14,\n",
       "         477.0: 17,\n",
       "         800.6666666666666: 3,\n",
       "         313.6666666666667: 6,\n",
       "         331.6666666666667: 12,\n",
       "         446.3333333333333: 14,\n",
       "         734.0: 7,\n",
       "         699.6666666666666: 10,\n",
       "         211.0: 9,\n",
       "         447.6666666666667: 14,\n",
       "         151.0: 5,\n",
       "         651.0: 7,\n",
       "         836.3333333333334: 5,\n",
       "         129.0: 2,\n",
       "         228.33333333333334: 1,\n",
       "         540.0: 19,\n",
       "         454.0: 15,\n",
       "         618.0: 9,\n",
       "         450.6666666666667: 13,\n",
       "         738.0: 5,\n",
       "         444.0: 15,\n",
       "         376.6666666666667: 15,\n",
       "         469.0: 25,\n",
       "         366.3333333333333: 9,\n",
       "         952.6666666666666: 1,\n",
       "         385.6666666666667: 19,\n",
       "         297.3333333333333: 9,\n",
       "         587.0: 17,\n",
       "         598.6666666666666: 25,\n",
       "         721.0: 13,\n",
       "         490.0: 9,\n",
       "         432.6666666666667: 17,\n",
       "         401.0: 20,\n",
       "         295.6666666666667: 9,\n",
       "         324.6666666666667: 12,\n",
       "         540.6666666666666: 16,\n",
       "         670.0: 9,\n",
       "         690.0: 11,\n",
       "         518.6666666666666: 23,\n",
       "         557.0: 21,\n",
       "         550.6666666666666: 9,\n",
       "         746.0: 9,\n",
       "         170.0: 4,\n",
       "         163.33333333333334: 3,\n",
       "         429.0: 17,\n",
       "         789.0: 3,\n",
       "         336.0: 12,\n",
       "         483.6666666666667: 15,\n",
       "         372.0: 14,\n",
       "         281.3333333333333: 9,\n",
       "         215.33333333333334: 3,\n",
       "         765.6666666666666: 3,\n",
       "         515.3333333333334: 18,\n",
       "         286.3333333333333: 7,\n",
       "         561.3333333333334: 20,\n",
       "         716.6666666666666: 10,\n",
       "         339.3333333333333: 8,\n",
       "         626.3333333333334: 8,\n",
       "         770.0: 9,\n",
       "         566.3333333333334: 16,\n",
       "         504.0: 15,\n",
       "         680.3333333333334: 10,\n",
       "         658.0: 8,\n",
       "         375.6666666666667: 9,\n",
       "         629.0: 13,\n",
       "         174.0: 6,\n",
       "         416.3333333333333: 20,\n",
       "         722.6666666666666: 10,\n",
       "         575.6666666666666: 14,\n",
       "         689.3333333333334: 9,\n",
       "         308.0: 9,\n",
       "         453.3333333333333: 28,\n",
       "         399.0: 14,\n",
       "         302.3333333333333: 8,\n",
       "         485.6666666666667: 13,\n",
       "         687.0: 9,\n",
       "         186.66666666666666: 3,\n",
       "         879.3333333333334: 3,\n",
       "         355.6666666666667: 14,\n",
       "         155.33333333333334: 6,\n",
       "         495.6666666666667: 18,\n",
       "         896.3333333333334: 2,\n",
       "         544.3333333333334: 16,\n",
       "         558.6666666666666: 23,\n",
       "         508.0: 15,\n",
       "         629.6666666666666: 19,\n",
       "         393.6666666666667: 14,\n",
       "         366.0: 13,\n",
       "         441.6666666666667: 25,\n",
       "         472.3333333333333: 11,\n",
       "         801.3333333333334: 3,\n",
       "         705.0: 8,\n",
       "         512.0: 14,\n",
       "         647.6666666666666: 17,\n",
       "         886.6666666666666: 1,\n",
       "         556.6666666666666: 13,\n",
       "         633.6666666666666: 14,\n",
       "         401.3333333333333: 9,\n",
       "         585.3333333333334: 23,\n",
       "         727.3333333333334: 4,\n",
       "         132.66666666666666: 3,\n",
       "         194.0: 3,\n",
       "         857.3333333333334: 4,\n",
       "         586.6666666666666: 17,\n",
       "         339.0: 11,\n",
       "         581.6666666666666: 19,\n",
       "         297.0: 7,\n",
       "         404.3333333333333: 14,\n",
       "         279.0: 3,\n",
       "         280.6666666666667: 7,\n",
       "         411.6666666666667: 15,\n",
       "         706.6666666666666: 8,\n",
       "         652.3333333333334: 9,\n",
       "         673.3333333333334: 6,\n",
       "         487.6666666666667: 11,\n",
       "         314.6666666666667: 11,\n",
       "         657.0: 13,\n",
       "         684.6666666666666: 7,\n",
       "         497.3333333333333: 16,\n",
       "         543.6666666666666: 17,\n",
       "         589.3333333333334: 15,\n",
       "         602.6666666666666: 11,\n",
       "         867.0: 1,\n",
       "         328.0: 15,\n",
       "         457.6666666666667: 17,\n",
       "         332.0: 11,\n",
       "         807.0: 1,\n",
       "         659.0: 13,\n",
       "         348.6666666666667: 20,\n",
       "         679.0: 11,\n",
       "         635.0: 19,\n",
       "         523.6666666666666: 16,\n",
       "         278.3333333333333: 15,\n",
       "         636.6666666666666: 14,\n",
       "         340.6666666666667: 13,\n",
       "         477.6666666666667: 13,\n",
       "         276.3333333333333: 8,\n",
       "         535.6666666666666: 16,\n",
       "         503.3333333333333: 16,\n",
       "         837.6666666666666: 4,\n",
       "         372.3333333333333: 7,\n",
       "         335.3333333333333: 9,\n",
       "         248.66666666666666: 8,\n",
       "         468.3333333333333: 19,\n",
       "         475.0: 12,\n",
       "         576.6666666666666: 17,\n",
       "         463.6666666666667: 19,\n",
       "         428.3333333333333: 16,\n",
       "         149.66666666666666: 7,\n",
       "         445.0: 18,\n",
       "         520.6666666666666: 12,\n",
       "         810.6666666666666: 7,\n",
       "         624.6666666666666: 23,\n",
       "         435.6666666666667: 6,\n",
       "         487.0: 19,\n",
       "         691.0: 6,\n",
       "         380.6666666666667: 15,\n",
       "         727.0: 10,\n",
       "         448.6666666666667: 17,\n",
       "         616.0: 16,\n",
       "         659.6666666666666: 11,\n",
       "         526.6666666666666: 17,\n",
       "         583.6666666666666: 15,\n",
       "         720.6666666666666: 3,\n",
       "         397.3333333333333: 15,\n",
       "         489.0: 13,\n",
       "         476.0: 15,\n",
       "         788.6666666666666: 2,\n",
       "         364.3333333333333: 10,\n",
       "         304.0: 14,\n",
       "         551.6666666666666: 18,\n",
       "         236.0: 9,\n",
       "         529.3333333333334: 18,\n",
       "         196.0: 4,\n",
       "         616.6666666666666: 15,\n",
       "         145.33333333333334: 2,\n",
       "         572.3333333333334: 12,\n",
       "         706.0: 5,\n",
       "         421.0: 20,\n",
       "         571.0: 25,\n",
       "         323.6666666666667: 11,\n",
       "         279.6666666666667: 11,\n",
       "         223.66666666666666: 3,\n",
       "         455.3333333333333: 12,\n",
       "         688.3333333333334: 10,\n",
       "         248.0: 8,\n",
       "         364.6666666666667: 12,\n",
       "         471.0: 19,\n",
       "         378.0: 12,\n",
       "         368.0: 9,\n",
       "         438.0: 10,\n",
       "         788.3333333333334: 6,\n",
       "         431.6666666666667: 13,\n",
       "         809.6666666666666: 2,\n",
       "         605.3333333333334: 19,\n",
       "         452.3333333333333: 16,\n",
       "         776.3333333333334: 13,\n",
       "         771.6666666666666: 8,\n",
       "         349.6666666666667: 9,\n",
       "         571.3333333333334: 22,\n",
       "         447.3333333333333: 13,\n",
       "         423.6666666666667: 18,\n",
       "         637.6666666666666: 12,\n",
       "         412.0: 16,\n",
       "         709.6666666666666: 8,\n",
       "         766.0: 4,\n",
       "         397.6666666666667: 15,\n",
       "         583.3333333333334: 14,\n",
       "         611.0: 19,\n",
       "         572.0: 13,\n",
       "         796.3333333333334: 5,\n",
       "         178.33333333333334: 6,\n",
       "         616.3333333333334: 10,\n",
       "         603.6666666666666: 16,\n",
       "         470.3333333333333: 22,\n",
       "         805.3333333333334: 3,\n",
       "         593.6666666666666: 18,\n",
       "         266.3333333333333: 6,\n",
       "         226.66666666666666: 3,\n",
       "         832.0: 2,\n",
       "         387.0: 9,\n",
       "         638.3333333333334: 16,\n",
       "         283.3333333333333: 8,\n",
       "         341.6666666666667: 9,\n",
       "         679.6666666666666: 6,\n",
       "         531.0: 17,\n",
       "         427.3333333333333: 17,\n",
       "         395.3333333333333: 16,\n",
       "         371.0: 18,\n",
       "         436.3333333333333: 12,\n",
       "         609.0: 9,\n",
       "         670.6666666666666: 10,\n",
       "         260.6666666666667: 6,\n",
       "         516.6666666666666: 16,\n",
       "         573.0: 21,\n",
       "         325.0: 14,\n",
       "         249.33333333333334: 11,\n",
       "         243.33333333333334: 6,\n",
       "         338.6666666666667: 15,\n",
       "         566.0: 15,\n",
       "         303.3333333333333: 5,\n",
       "         692.3333333333334: 16,\n",
       "         199.0: 7,\n",
       "         239.33333333333334: 5,\n",
       "         414.6666666666667: 12,\n",
       "         582.6666666666666: 18,\n",
       "         451.3333333333333: 11,\n",
       "         608.3333333333334: 13,\n",
       "         153.33333333333334: 3,\n",
       "         741.3333333333334: 7,\n",
       "         393.0: 25,\n",
       "         244.66666666666666: 6,\n",
       "         396.3333333333333: 24,\n",
       "         428.6666666666667: 10,\n",
       "         546.3333333333334: 12,\n",
       "         491.3333333333333: 16,\n",
       "         693.3333333333334: 14,\n",
       "         231.33333333333334: 5,\n",
       "         563.6666666666666: 15,\n",
       "         594.3333333333334: 11,\n",
       "         455.0: 16,\n",
       "         524.6666666666666: 25,\n",
       "         712.3333333333334: 9,\n",
       "         622.0: 22,\n",
       "         500.6666666666667: 20,\n",
       "         564.3333333333334: 15,\n",
       "         537.3333333333334: 19,\n",
       "         269.3333333333333: 7,\n",
       "         757.0: 7,\n",
       "         539.3333333333334: 16,\n",
       "         935.0: 2,\n",
       "         330.3333333333333: 10,\n",
       "         499.6666666666667: 19,\n",
       "         544.6666666666666: 13,\n",
       "         300.6666666666667: 8,\n",
       "         663.0: 12,\n",
       "         637.0: 12,\n",
       "         723.0: 9,\n",
       "         298.6666666666667: 8,\n",
       "         798.3333333333334: 6,\n",
       "         698.0: 8,\n",
       "         669.0: 16,\n",
       "         733.3333333333334: 9,\n",
       "         803.6666666666666: 4,\n",
       "         259.6666666666667: 3,\n",
       "         282.0: 9,\n",
       "         443.6666666666667: 27,\n",
       "         562.0: 21,\n",
       "         412.6666666666667: 18,\n",
       "         688.6666666666666: 10,\n",
       "         326.6666666666667: 15,\n",
       "         481.6666666666667: 12,\n",
       "         694.6666666666666: 11,\n",
       "         510.3333333333333: 23,\n",
       "         723.6666666666666: 5,\n",
       "         334.3333333333333: 8,\n",
       "         293.6666666666667: 6,\n",
       "         754.6666666666666: 5,\n",
       "         620.0: 12,\n",
       "         402.3333333333333: 18,\n",
       "         862.3333333333334: 3,\n",
       "         340.3333333333333: 13,\n",
       "         645.3333333333334: 12,\n",
       "         216.66666666666666: 4,\n",
       "         752.0: 9,\n",
       "         666.3333333333334: 15,\n",
       "         513.6666666666666: 12,\n",
       "         607.3333333333334: 15,\n",
       "         392.0: 19,\n",
       "         470.6666666666667: 18,\n",
       "         486.3333333333333: 12,\n",
       "         544.0: 17,\n",
       "         382.3333333333333: 18,\n",
       "         389.6666666666667: 15,\n",
       "         354.3333333333333: 12,\n",
       "         388.0: 11,\n",
       "         808.3333333333334: 3,\n",
       "         497.6666666666667: 16,\n",
       "         557.6666666666666: 14,\n",
       "         579.0: 18,\n",
       "         122.33333333333333: 2,\n",
       "         474.3333333333333: 14,\n",
       "         379.6666666666667: 10,\n",
       "         406.0: 8,\n",
       "         634.3333333333334: 16,\n",
       "         734.3333333333334: 7,\n",
       "         383.6666666666667: 15,\n",
       "         338.0: 12,\n",
       "         122.0: 2,\n",
       "         271.0: 6,\n",
       "         525.6666666666666: 16,\n",
       "         564.0: 17,\n",
       "         476.6666666666667: 26,\n",
       "         622.3333333333334: 14,\n",
       "         448.3333333333333: 21,\n",
       "         107.0: 1,\n",
       "         762.3333333333334: 4,\n",
       "         501.0: 15,\n",
       "         148.33333333333334: 3,\n",
       "         541.3333333333334: 24,\n",
       "         476.3333333333333: 19,\n",
       "         311.0: 13,\n",
       "         317.3333333333333: 7,\n",
       "         449.0: 12,\n",
       "         550.0: 16,\n",
       "         163.0: 3,\n",
       "         581.3333333333334: 13,\n",
       "         309.0: 16,\n",
       "         352.0: 10,\n",
       "         418.0: 13,\n",
       "         365.0: 8,\n",
       "         181.0: 5,\n",
       "         827.6666666666666: 4,\n",
       "         456.3333333333333: 20,\n",
       "         285.6666666666667: 9,\n",
       "         299.3333333333333: 8,\n",
       "         268.3333333333333: 9,\n",
       "         254.66666666666666: 3,\n",
       "         405.0: 14,\n",
       "         446.6666666666667: 19,\n",
       "         275.3333333333333: 4,\n",
       "         541.0: 14,\n",
       "         689.6666666666666: 9,\n",
       "         738.3333333333334: 9,\n",
       "         848.3333333333334: 2,\n",
       "         191.33333333333334: 4,\n",
       "         588.3333333333334: 11,\n",
       "         532.0: 14,\n",
       "         523.0: 22,\n",
       "         385.0: 18,\n",
       "         503.6666666666667: 21,\n",
       "         555.0: 13,\n",
       "         556.3333333333334: 14,\n",
       "         39.0: 1,\n",
       "         537.6666666666666: 12,\n",
       "         528.6666666666666: 23,\n",
       "         486.6666666666667: 13,\n",
       "         242.0: 8,\n",
       "         351.0: 19,\n",
       "         521.3333333333334: 18,\n",
       "         592.6666666666666: 13,\n",
       "         442.0: 10,\n",
       "         871.6666666666666: 3,\n",
       "         465.6666666666667: 20,\n",
       "         240.66666666666666: 4,\n",
       "         241.33333333333334: 1,\n",
       "         464.3333333333333: 18,\n",
       "         535.0: 18,\n",
       "         546.6666666666666: 17,\n",
       "         511.0: 26,\n",
       "         604.6666666666666: 14,\n",
       "         613.0: 9,\n",
       "         751.0: 4,\n",
       "         196.66666666666666: 8,\n",
       "         703.6666666666666: 5,\n",
       "         564.6666666666666: 12,\n",
       "         862.6666666666666: 3,\n",
       "         574.0: 14,\n",
       "         201.0: 4,\n",
       "         517.3333333333334: 11,\n",
       "         352.6666666666667: 16,\n",
       "         394.3333333333333: 8,\n",
       "         624.0: 19,\n",
       "         743.6666666666666: 5,\n",
       "         347.6666666666667: 21,\n",
       "         194.33333333333334: 4,\n",
       "         723.3333333333334: 8,\n",
       "         215.0: 4,\n",
       "         454.3333333333333: 15,\n",
       "         474.6666666666667: 20,\n",
       "         440.0: 13,\n",
       "         658.3333333333334: 13,\n",
       "         357.6666666666667: 13,\n",
       "         735.3333333333334: 6,\n",
       "         549.3333333333334: 17,\n",
       "         627.3333333333334: 9,\n",
       "         470.0: 21,\n",
       "         390.3333333333333: 14,\n",
       "         547.0: 17,\n",
       "         530.0: 15,\n",
       "         302.6666666666667: 10,\n",
       "         654.6666666666666: 11,\n",
       "         466.0: 13,\n",
       "         453.6666666666667: 11,\n",
       "         778.0: 4,\n",
       "         110.33333333333333: 2,\n",
       "         649.3333333333334: 10,\n",
       "         615.3333333333334: 16,\n",
       "         658.6666666666666: 17,\n",
       "         607.0: 20,\n",
       "         614.3333333333334: 17,\n",
       "         621.6666666666666: 17,\n",
       "         427.0: 13,\n",
       "         387.6666666666667: 15,\n",
       "         619.0: 10,\n",
       "         423.3333333333333: 17,\n",
       "         485.3333333333333: 17,\n",
       "         337.3333333333333: 10,\n",
       "         893.0: 2,\n",
       "         513.0: 27,\n",
       "         317.6666666666667: 9,\n",
       "         343.3333333333333: 18,\n",
       "         672.3333333333334: 8,\n",
       "         359.0: 13,\n",
       "         500.3333333333333: 19,\n",
       "         458.0: 24,\n",
       "         288.6666666666667: 9,\n",
       "         183.66666666666666: 5,\n",
       "         650.0: 24,\n",
       "         718.3333333333334: 12,\n",
       "         697.0: 10,\n",
       "         312.6666666666667: 7,\n",
       "         685.0: 12,\n",
       "         198.66666666666666: 1,\n",
       "         297.6666666666667: 12,\n",
       "         769.3333333333334: 5,\n",
       "         169.0: 5,\n",
       "         856.6666666666666: 3,\n",
       "         525.3333333333334: 15,\n",
       "         273.3333333333333: 5,\n",
       "         700.0: 12,\n",
       "         496.3333333333333: 13,\n",
       "         815.3333333333334: 6,\n",
       "         444.6666666666667: 13,\n",
       "         240.0: 10,\n",
       "         519.0: 25,\n",
       "         492.3333333333333: 23,\n",
       "         235.66666666666666: 4,\n",
       "         810.0: 2,\n",
       "         643.3333333333334: 16,\n",
       "         612.3333333333334: 14,\n",
       "         707.3333333333334: 10,\n",
       "         766.3333333333334: 6,\n",
       "         739.0: 8,\n",
       "         344.6666666666667: 8,\n",
       "         483.0: 22,\n",
       "         752.3333333333334: 3,\n",
       "         601.3333333333334: 13,\n",
       "         379.3333333333333: 7,\n",
       "         678.0: 14,\n",
       "         560.6666666666666: 22,\n",
       "         252.0: 9,\n",
       "         254.0: 5,\n",
       "         383.0: 9,\n",
       "         449.3333333333333: 21,\n",
       "         440.6666666666667: 15,\n",
       "         423.0: 14,\n",
       "         508.3333333333333: 13,\n",
       "         598.0: 17,\n",
       "         600.0: 16,\n",
       "         258.3333333333333: 3,\n",
       "         336.3333333333333: 14,\n",
       "         846.6666666666666: 2,\n",
       "         495.3333333333333: 11,\n",
       "         596.3333333333334: 15,\n",
       "         845.3333333333334: 3,\n",
       "         554.0: 15,\n",
       "         670.3333333333334: 10,\n",
       "         734.6666666666666: 6,\n",
       "         749.3333333333334: 7,\n",
       "         563.0: 20,\n",
       "         465.0: 17,\n",
       "         595.3333333333334: 22,\n",
       "         189.0: 6,\n",
       "         632.3333333333334: 12,\n",
       "         216.0: 5,\n",
       "         681.0: 13,\n",
       "         204.66666666666666: 5,\n",
       "         257.3333333333333: 4,\n",
       "         660.3333333333334: 13,\n",
       "         579.6666666666666: 19,\n",
       "         479.3333333333333: 12,\n",
       "         467.6666666666667: 20,\n",
       "         526.0: 14,\n",
       "         187.0: 4,\n",
       "         353.0: 11,\n",
       "         405.6666666666667: 8,\n",
       "         432.0: 18,\n",
       "         312.0: 14,\n",
       "         692.0: 9,\n",
       "         410.6666666666667: 20,\n",
       "         578.3333333333334: 11,\n",
       "         414.3333333333333: 17,\n",
       "         586.3333333333334: 15,\n",
       "         421.6666666666667: 14,\n",
       "         240.33333333333334: 3,\n",
       "         195.33333333333334: 6,\n",
       "         407.3333333333333: 7,\n",
       "         403.3333333333333: 18,\n",
       "         304.3333333333333: 7,\n",
       "         704.3333333333334: 10,\n",
       "         426.3333333333333: 17,\n",
       "         451.6666666666667: 20,\n",
       "         755.3333333333334: 8,\n",
       "         441.0: 14,\n",
       "         350.3333333333333: 10,\n",
       "         475.6666666666667: 16,\n",
       "         411.3333333333333: 16,\n",
       "         623.0: 10,\n",
       "         533.3333333333334: 16,\n",
       "         729.6666666666666: 9,\n",
       "         158.66666666666666: 5,\n",
       "         716.0: 8,\n",
       "         575.0: 20,\n",
       "         524.0: 26,\n",
       "         198.0: 7,\n",
       "         496.6666666666667: 14,\n",
       "         558.3333333333334: 18,\n",
       "         595.6666666666666: 19,\n",
       "         517.6666666666666: 14,\n",
       "         396.6666666666667: 13,\n",
       "         380.3333333333333: 18,\n",
       "         569.6666666666666: 9,\n",
       "         824.3333333333334: 3,\n",
       "         584.3333333333334: 13,\n",
       "         590.6666666666666: 16,\n",
       "         614.6666666666666: 20,\n",
       "         265.3333333333333: 10,\n",
       "         788.0: 5,\n",
       "         786.3333333333334: 3,\n",
       "         744.0: 9,\n",
       "         593.0: 22,\n",
       "         594.6666666666666: 16,\n",
       "         62.333333333333336: 1,\n",
       "         403.0: 10,\n",
       "         772.3333333333334: 2,\n",
       "         273.6666666666667: 8,\n",
       "         770.3333333333334: 4,\n",
       "         463.0: 15,\n",
       "         491.6666666666667: 22,\n",
       "         399.6666666666667: 10,\n",
       "         582.0: 18,\n",
       "         485.0: 19,\n",
       "         381.6666666666667: 12,\n",
       "         661.3333333333334: 10,\n",
       "         629.3333333333334: 14,\n",
       "         611.6666666666666: 15,\n",
       "         697.6666666666666: 6,\n",
       "         686.0: 10,\n",
       "         542.0: 15,\n",
       "         628.0: 15,\n",
       "         639.6666666666666: 16,\n",
       "         315.6666666666667: 11,\n",
       "         277.0: 12,\n",
       "         320.3333333333333: 13,\n",
       "         232.66666666666666: 5,\n",
       "         550.3333333333334: 12,\n",
       "         96.33333333333333: 2,\n",
       "         822.3333333333334: 4,\n",
       "         565.3333333333334: 16,\n",
       "         376.3333333333333: 12,\n",
       "         769.6666666666666: 1,\n",
       "         527.6666666666666: 10,\n",
       "         437.6666666666667: 27,\n",
       "         568.6666666666666: 10,\n",
       "         311.6666666666667: 11,\n",
       "         275.0: 8,\n",
       "         175.0: 3,\n",
       "         538.0: 10,\n",
       "         388.3333333333333: 14,\n",
       "         766.6666666666666: 9,\n",
       "         277.6666666666667: 8,\n",
       "         570.0: 12,\n",
       "         575.3333333333334: 19,\n",
       "         368.6666666666667: 19,\n",
       "         457.0: 22,\n",
       "         390.0: 17,\n",
       "         785.3333333333334: 8,\n",
       "         726.0: 10,\n",
       "         474.0: 15,\n",
       "         442.6666666666667: 20,\n",
       "         461.3333333333333: 20,\n",
       "         422.3333333333333: 16,\n",
       "         715.6666666666666: 7,\n",
       "         307.3333333333333: 15,\n",
       "         743.3333333333334: 9,\n",
       "         143.33333333333334: 2,\n",
       "         438.3333333333333: 12,\n",
       "         736.0: 10,\n",
       "         647.3333333333334: 21,\n",
       "         490.6666666666667: 13,\n",
       "         461.6666666666667: 24,\n",
       "         493.6666666666667: 16,\n",
       "         279.3333333333333: 9,\n",
       "         381.0: 9,\n",
       "         701.6666666666666: 14,\n",
       "         642.3333333333334: 13,\n",
       "         467.0: 18,\n",
       "         229.66666666666666: 5,\n",
       "         704.6666666666666: 11,\n",
       "         567.0: 13,\n",
       "         418.6666666666667: 18,\n",
       "         664.6666666666666: 10,\n",
       "         568.3333333333334: 9,\n",
       "         282.3333333333333: 3,\n",
       "         382.0: 14,\n",
       "         612.6666666666666: 18,\n",
       "         599.3333333333334: 12,\n",
       "         548.3333333333334: 10,\n",
       "         378.3333333333333: 12,\n",
       "         627.0: 20,\n",
       "         506.3333333333333: 16,\n",
       "         181.33333333333334: 6,\n",
       "         360.3333333333333: 13,\n",
       "         625.0: 17,\n",
       "         315.0: 8,\n",
       "         294.6666666666667: 14,\n",
       "         531.3333333333334: 14,\n",
       "         488.0: 15,\n",
       "         696.3333333333334: 3,\n",
       "         185.33333333333334: 2,\n",
       "         356.6666666666667: 10,\n",
       "         289.6666666666667: 8,\n",
       "         299.6666666666667: 11,\n",
       "         545.3333333333334: 22,\n",
       "         566.6666666666666: 16,\n",
       "         221.0: 3,\n",
       "         250.0: 5,\n",
       "         515.6666666666666: 24,\n",
       "         662.6666666666666: 13,\n",
       "         535.3333333333334: 20,\n",
       "         117.33333333333333: 2,\n",
       "         280.3333333333333: 3,\n",
       "         327.3333333333333: 6,\n",
       "         678.3333333333334: 15,\n",
       "         534.3333333333334: 13,\n",
       "         836.6666666666666: 3,\n",
       "         100.0: 3,\n",
       "         388.6666666666667: 15,\n",
       "         576.3333333333334: 10,\n",
       "         493.3333333333333: 14,\n",
       "         420.3333333333333: 16,\n",
       "         230.66666666666666: 7,\n",
       "         422.6666666666667: 13,\n",
       "         307.0: 10,\n",
       "         313.3333333333333: 9,\n",
       "         495.0: 10,\n",
       "         314.0: 5,\n",
       "         469.3333333333333: 13,\n",
       "         682.6666666666666: 15,\n",
       "         551.0: 9,\n",
       "         425.6666666666667: 17,\n",
       "         528.3333333333334: 17,\n",
       "         573.6666666666666: 15,\n",
       "         413.6666666666667: 20,\n",
       "         686.3333333333334: 14,\n",
       "         857.6666666666666: 7,\n",
       "         608.6666666666666: 10,\n",
       "         270.3333333333333: 11,\n",
       "         509.3333333333333: 10,\n",
       "         543.0: 17,\n",
       "         281.0: 6,\n",
       "         72.0: 2,\n",
       "         741.0: 7,\n",
       "         475.3333333333333: 12,\n",
       "         341.0: 12,\n",
       "         347.0: 13,\n",
       "         699.0: 9,\n",
       "         624.3333333333334: 17,\n",
       "         613.6666666666666: 16,\n",
       "         533.6666666666666: 17,\n",
       "         259.0: 9,\n",
       "         238.33333333333334: 4,\n",
       "         700.3333333333334: 8,\n",
       "         501.6666666666667: 16,\n",
       "         427.6666666666667: 11,\n",
       "         542.6666666666666: 12,\n",
       "         585.0: 6,\n",
       "         482.6666666666667: 16,\n",
       "         308.6666666666667: 14,\n",
       "         605.0: 16,\n",
       "         683.6666666666666: 4,\n",
       "         220.66666666666666: 4,\n",
       "         338.3333333333333: 12,\n",
       "         702.0: 10,\n",
       "         590.3333333333334: 13,\n",
       "         773.0: 11,\n",
       "         764.6666666666666: 5,\n",
       "         481.0: 20,\n",
       "         342.6666666666667: 12,\n",
       "         271.3333333333333: 10,\n",
       "         572.6666666666666: 15,\n",
       "         707.6666666666666: 7,\n",
       "         417.3333333333333: 23,\n",
       "         299.0: 11,\n",
       "         671.6666666666666: 8,\n",
       "         568.0: 15,\n",
       "         379.0: 11,\n",
       "         429.3333333333333: 9,\n",
       "         621.0: 14,\n",
       "         301.6666666666667: 4,\n",
       "         478.6666666666667: 14,\n",
       "         599.0: 14,\n",
       "         144.0: 5,\n",
       "         394.0: 20,\n",
       "         693.0: 7,\n",
       "         494.0: 19,\n",
       "         402.0: 17,\n",
       "         453.0: 11,\n",
       "         634.0: 14,\n",
       "         380.0: 15,\n",
       "         340.0: 15,\n",
       "         292.6666666666667: 9,\n",
       "         377.6666666666667: 11,\n",
       "         318.6666666666667: 10,\n",
       "         429.6666666666667: 17,\n",
       "         227.33333333333334: 4,\n",
       "         677.6666666666666: 12,\n",
       "         619.3333333333334: 10,\n",
       "         146.33333333333334: 4,\n",
       "         695.6666666666666: 9,\n",
       "         417.6666666666667: 14,\n",
       "         793.0: 5,\n",
       "         605.6666666666666: 12,\n",
       "         259.3333333333333: 8,\n",
       "         351.3333333333333: 14,\n",
       "         554.6666666666666: 22,\n",
       "         434.0: 13,\n",
       "         726.6666666666666: 11,\n",
       "         641.6666666666666: 14,\n",
       "         346.3333333333333: 15,\n",
       "         724.3333333333334: 3,\n",
       "         519.6666666666666: 18,\n",
       "         602.0: 16,\n",
       "         794.6666666666666: 8,\n",
       "         580.6666666666666: 12,\n",
       "         806.0: 6,\n",
       "         792.3333333333334: 8,\n",
       "         191.66666666666666: 2,\n",
       "         345.6666666666667: 12,\n",
       "         708.0: 12,\n",
       "         405.3333333333333: 16,\n",
       "         153.0: 3,\n",
       "         537.0: 17,\n",
       "         576.0: 16,\n",
       "         398.6666666666667: 16,\n",
       "         462.0: 14,\n",
       "         369.0: 20,\n",
       "         693.6666666666666: 11,\n",
       "         529.0: 21,\n",
       "         556.0: 19,\n",
       "         818.0: 3,\n",
       "         154.0: 4,\n",
       "         579.3333333333334: 16,\n",
       "         288.3333333333333: 9,\n",
       "         361.0: 19,\n",
       "         631.3333333333334: 11,\n",
       "         552.3333333333334: 18,\n",
       "         725.0: 6,\n",
       "         814.0: 7,\n",
       "         517.0: 15,\n",
       "         392.3333333333333: 15,\n",
       "         623.6666666666666: 22,\n",
       "         464.6666666666667: 9,\n",
       "         511.3333333333333: 17,\n",
       "         773.6666666666666: 9,\n",
       "         617.3333333333334: 12,\n",
       "         910.6666666666666: 3,\n",
       "         439.6666666666667: 19,\n",
       "         383.3333333333333: 9,\n",
       "         301.3333333333333: 11,\n",
       "         649.0: 10,\n",
       "         513.3333333333334: 14,\n",
       "         597.0: 9,\n",
       "         436.6666666666667: 21,\n",
       "         549.6666666666666: 14,\n",
       "         319.6666666666667: 8,\n",
       "         744.6666666666666: 8,\n",
       "         235.0: 6,\n",
       "         480.6666666666667: 16,\n",
       "         698.6666666666666: 7,\n",
       "         352.3333333333333: 15,\n",
       "         606.0: 11,\n",
       "         736.3333333333334: 4,\n",
       "         646.6666666666666: 14,\n",
       "         567.6666666666666: 16,\n",
       "         745.0: 5,\n",
       "         516.3333333333334: 17,\n",
       "         787.0: 1,\n",
       "         400.0: 13,\n",
       "         395.6666666666667: 8,\n",
       "         222.0: 3,\n",
       "         438.6666666666667: 17,\n",
       "         690.3333333333334: 9,\n",
       "         155.0: 2,\n",
       "         440.3333333333333: 14,\n",
       "         450.3333333333333: 20,\n",
       "         731.3333333333334: 9,\n",
       "         330.0: 13,\n",
       "         329.6666666666667: 9,\n",
       "         386.0: 17,\n",
       "         374.0: 10,\n",
       "         296.3333333333333: 12,\n",
       "         359.6666666666667: 8,\n",
       "         293.3333333333333: 9,\n",
       "         274.6666666666667: 4,\n",
       "         631.0: 17,\n",
       "         413.0: 15,\n",
       "         690.6666666666666: 16,\n",
       "         630.0: 13,\n",
       "         577.3333333333334: 19,\n",
       "         750.3333333333334: 5,\n",
       "         403.6666666666667: 26,\n",
       "         731.6666666666666: 8,\n",
       "         560.3333333333334: 16,\n",
       "         763.3333333333334: 10,\n",
       "         256.6666666666667: 7,\n",
       "         713.6666666666666: 12,\n",
       "         804.0: 2,\n",
       "         327.0: 12,\n",
       "         210.33333333333334: 2,\n",
       "         578.0: 12,\n",
       "         188.33333333333334: 4,\n",
       "         679.3333333333334: 7,\n",
       "         500.0: 16,\n",
       "         224.0: 6,\n",
       "         533.0: 13,\n",
       "         305.6666666666667: 9,\n",
       "         ...})"
      ]
     },
     "execution_count": 26,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "Counter(n_flag_peo['从业人数'])"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [],
   "source": []
  }
 ],
 "metadata": {
  "kernelspec": {
   "display_name": "Python 3",
   "language": "python",
   "name": "python3"
  },
  "language_info": {
   "codemirror_mode": {
    "name": "ipython",
    "version": 3
   },
   "file_extension": ".py",
   "mimetype": "text/x-python",
   "name": "python",
   "nbconvert_exporter": "python",
   "pygments_lexer": "ipython3",
   "version": "3.6.10"
  }
 },
 "nbformat": 4,
 "nbformat_minor": 4
}
